টি-স্নে ডাইমেনশনগুলি কি অর্থবহ?


18

টি-স্নেড এমবেডিংয়ের মাত্রাগুলির কোনও অর্থ আছে কি? পিসিএর মতো আমরাও এই রৈখিক রূপান্তরিত বৈকল্পিকতা সর্বাধিকীকরণের অনুভূতিটি পেয়েছি তবে টি-স্নে জন্য কেএল-দূরত্বের ম্যাপিং এবং মিনিমাইজেশনের জন্য আমরা যে স্থানটি সংজ্ঞায়িত করেছি সেগুলি ছাড়াও কি স্বজ্ঞাততা আছে?


1
আপনি যা জিজ্ঞাসা করছেন এটি সত্যিই এটি পেয়ে যায় কিনা তা নিশ্চিত নয় তবে আমি বিশ্বাস করি যে টি-স্নের মাত্রাগুলি কেবলমাত্র ডেটার পৃথকীকরণের উপর নির্ভর করে। একই ডেটাসেটের সাহায্যে মাত্রা পরিবর্তন করতে পারে কারণ এটি একটি অ-রৈখিক রূপান্তর। সুতরাং মাত্রাগুলি কেবল প্রদত্ত উদাহরণের প্রসঙ্গেই সত্যই ব্যাখ্যা করা যায়। আমি ভুল হলে আমাকে জানাবেন, এটি একটি আকর্ষণীয় প্রশ্ন।
হবিস

সম্ভবত এটি পুরানো ℝ3 বিরক্তিকর হয়?
নাইট্রো

উত্তর:


17

নিম্ন মাত্রিক স্থানের মাত্রাগুলির কোনও অর্থ নেই। মনে রাখবেন যে টি-এসএনই ক্ষতির ফাংশনটি সম্পূর্ণরূপে পয়েন্টগুলির মধ্যে দূরত্ব ( এবং ) এবং সেই সমস্ত দূরত্বগুলির (সম্ভাব্যতা) বিতরণের উপর ভিত্তি করে ( এবং ):yiyjpijqij

δCδyi=4j(pijqij)(yiyj)(1+||yiyj||2)1

সুতরাং পুরো উচ্চ-মাত্রিক স্থান থেকে নিম্ন-মাত্রিক স্থানটিতে কোনও প্রক্ষেপণ নেই, টি-এসএনই কেবলমাত্র উচ্চ মাত্রিক পয়েন্টগুলির একটি নির্দিষ্ট সেট থেকে নিম্ন মাত্রিক পয়েন্টগুলির একটি নির্দিষ্ট সেটে একটি ম্যাপিং খুঁজে পায়। কারণ এক স্থান থেকে অন্য স্থান পর্যন্ত কোনও ক্রিয়া নেই, সেখানে অক্ষগুলির অন্তর্নিহিত অর্থও নেই।

এটি চিত্রিত করার জন্য আপনি যে বিষয়গুলি কল্পনা করতে পারেন:

  • উচ্চ-মাত্রিক বা নিম্ন-মাত্রিক স্থান ঘোরানো বা অনুবাদ করা পয়েন্টগুলির মধ্যে দূরত্বকে প্রভাবিত করে না। অতএব, টি-এসএনই উভয় জায়গাতেই ঘোরানো বা অনুবাদ করতে পারে না। সুতরাং অক্ষগুলির নিখুঁত ব্যাখ্যা নেই।
  • টি-শিক্ষার্থী বিতরণে ফ্যাট লেজ রয়েছে। এটি নিম্ন-মাত্রিক প্রতিনিধিত্বকে উচ্চ-মাত্রিক জায়গার থেকে দূরে অবস্থিত পয়েন্টগুলির পরিবর্তনের জন্য অদম্য হয়ে উঠেছে। এর ফলে উচ্চ মাত্রিক জায়গাতে অনেক দূরে থাকা পয়েন্টগুলিও কম মাত্রার তুলনায় যুক্তিসঙ্গতভাবে অনেক দূরে বা সত্যই অনেক দূরে হতে পারে causes এই অর্থে এটি নিম্ন-মাত্রিক অক্ষের কিছু অংশকে প্রসারিত করে (কোনও স্বেচ্ছাচারিত দিকে)।

বলা হচ্ছে, টি-এসএনই মূলত একটি ভিজ্যুয়ালাইজেশন কৌশল এবং অন্য উদ্দেশ্যে এর মাত্রা হ্রাস কার্যকারিতা সুস্পষ্ট নয় (সম্ভবত ক্লাস্টারিং, বৈশিষ্ট্য নিষ্কাশন বা বৈশিষ্ট্য নির্বাচনের জন্য উপযুক্ত নয়)।

এছাড়াও: কাগজ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.