প্রথমে একটি সংক্ষিপ্ত উত্তর এবং তারপরে একটি দীর্ঘ মন্তব্য:
উত্তর
এসএনই কৌশলগুলি মূল ডেটা স্পেস এবং নিম্ন-মাত্রিক এম্বেডিং স্পেস উভয় ক্ষেত্রে একটি এন × এন মিল ম্যাট্রিক্সকে এমনভাবে গণনা করে যে মিলগুলি বস্তুর জোড়গুলির উপর সম্ভাব্যতা বন্টন গঠন করে। বিশেষত, সম্ভাব্যতাগুলি সাধারণত ইনপুট ডেটা বা এম্বেডিং থেকে গণিত একটি সাধারণ গাউসিয়ান কার্নেল দ্বারা দেওয়া হয়। শ্রেণিবিন্যাসের ক্ষেত্রে, এটি অবিলম্বে উদাহরণ-ভিত্তিক শিক্ষার পদ্ধতিগুলি মনে করে। আপনি তাদের মধ্যে একটি তালিকাভুক্ত করেছেন: এসবিএম এর আরবিএফ এর সাথে, এবং @ মিয়েবা কেএনএন তালিকাভুক্ত করেছে। এছাড়াও রেডিয়াল ভিত্তিক ফাংশন নেটওয়ার্ক রয়েছে , যা আমি কোনও বিশেষজ্ঞ নই।
মন্তব্য
এটি বলার পরে, আমি কেবলমাত্র টি-এসএনই প্লটের দিকে তাকিয়ে একটি ডেটাসেটে তথ্য তৈরির বিষয়ে দ্বিগুণ যত্নবান হব। t-SNE অগত্যা স্থানীয় কাঠামোর উপর ফোকাস করে না। তবে আপনি perplexity
প্যারামিটারটি টিউন করে এটি করার জন্য এটি সামঞ্জস্য করতে পারেন যা আপনার ডেটার স্থানীয় এবং বৈশ্বিক দিকগুলির মধ্যে কীভাবে মনোযোগ ভারসাম্য বজায় রাখবে (নিয়মিতভাবে) নিয়ন্ত্রণ করে।
এই প্রসঙ্গে, perplexity
প্রতিটি পর্যবেক্ষণে কতজন নিকটাত্মীয় প্রতিবেশী থাকতে পারে এবং ব্যবহারকারীর দ্বারা সরবরাহ করা হয় সে সম্পর্কে নিজেই অন্ধকারের ছোঁয়া। মূল কাগজ পদ বলে: "টি-Sne কর্মক্ষমতা মোটামুটি অজ্ঞানতায় নিমজ্জত পরিবর্তনের শক্তসমর্থ, এবং সাধারণত মান 5 এবং 50. মধ্যে হয়" তবে আমার অভিজ্ঞতাটি হ'ল টি-এসএনই থেকে সর্বাধিক পাওয়ার অর্থ হতে পারে বিভিন্ন বিভ্রান্তির সাথে একাধিক প্লট বিশ্লেষণ করা।
অন্য কথায়, টিউনিং learning rate
এবং perplexity
, একই সংখ্যক প্রশিক্ষণের পদক্ষেপের জন্য এবং একই ডেটা ব্যবহার করে খুব আলাদা দেখতে 2-ডি প্লট পাওয়া সম্ভব।
এই ডিস্টিল পেপার টি-এসএনই কীভাবে ব্যবহার করবেন তা কার্যকরভাবে টি-এসএনই বিশ্লেষণের সাধারণ ক্ষতিগুলির একটি দুর্দান্ত সংক্ষিপ্তসার দেয়। সংক্ষিপ্ত পয়েন্টগুলি হ'ল:
এই হাইপারপ্যারামিটারগুলি (যেমন শিখার হার, বিভ্রান্তি) সত্যিই গুরুত্বপূর্ণ
একটি টি-এসএনই প্লটে ক্লাস্টারের আকারগুলি কিছুই বোঝায় না
গুচ্ছগুলির মধ্যে দূরত্বের অর্থ কোনও অর্থ নেই
এলোমেলো গোলমাল সর্বদা এলোমেলো মনে হয় না।
আপনি কিছু আকার দেখতে পারেন, কখনও কখনও
টপোলজির জন্য আপনার একাধিক প্লটের প্রয়োজন হতে পারে
বিশেষত উপরের 2, 3, এবং 6 পয়েন্টগুলি থেকে, আমি পৃথক টি-এসএনই প্লটগুলি দেখে ডেটার পৃথকীকরণ সম্পর্কে ধারণা তৈরি করার বিষয়ে দু'বার চিন্তা করব। অনেকগুলি ক্ষেত্রেই আপনি প্লটগুলি 'উত্পাদন' করতে পারেন যা সঠিক পরামিতিগুলি ব্যবহার করে পরিষ্কার ক্লাস্টার দেখায়।