অটোরকোডার এবং টি-এসএনইয়ের মধ্যে পার্থক্য কী?


12

যতদূর আমি জানি, অটোইনকোডার এবং টি-এসএনই উভয়ই অরৈখিক মাত্রিকতা হ্রাস করার জন্য ব্যবহৃত হয়। তাদের মধ্যে পার্থক্যগুলি কী এবং কেন আমি অন্যকে বনাম ব্যবহার করব?

উত্তর:


8

তারা উভয়ই আপনার ডেটা এম্বেডিং একটি নিম্ন মাত্রিকতা খুঁজে পেতে চেষ্টা করুন। তবে ন্যূনতমকরণের বিভিন্ন সমস্যা রয়েছে। আরও সুনির্দিষ্টভাবে, একটি অটোরকোডার পুনর্গঠন ত্রুটি হ্রাস করার চেষ্টা করে, যখন টি-এসএনই একটি নিম্ন মাত্রিক স্থান আবিষ্কার করার চেষ্টা করে এবং একই সাথে এটি আশেপাশের দূরত্বগুলি সংরক্ষণ করার চেষ্টা করে। এই বৈশিষ্ট্যের ফলস্বরূপ, টি-এসএনই সাধারণত প্লট এবং ভিজ্যুয়ালাইজেশনের জন্য পছন্দ করা হয়।


সুতরাং এই অর্থে, এর অর্থ কী নীচের মাত্রা থ্রিডি-র চেয়ে বেশি হলে অটোরকোডারটি কম মাত্রা সন্ধান করা ভাল? (কারণ আমি ধরে নিয়েছি যদি নীচের মাত্রাটি বড় হয় তবে টি-
এসএনই

2
আপনার কাজের উপর নির্ভর করে অনেক ধরণের অটোরকোডার রয়েছে (স্পারস, ভেরিয়েশনাল, স্ট্যাকড, কনভ্যুশনাল ইত্যাদি)। পুনর্গঠন ত্রুটির ভিত্তিতে তারা নিম্ন মাত্রিক এম্বেডিংগুলি আবিষ্কার করতে খুব দক্ষ হতে পারে। অতএব, যদি আপনার কাজটি একটি সর্বোত্তম নিম্ন মাত্রিক স্থান (এমনকি 2 ডি) সন্ধান করতে হয় তবে আমি আপনাকে আপনার কাজের জন্য সঠিক স্বয়ংক্রিয়কোডার বাছাইয়ের পরামর্শ দেব। যদি আপনাকে ভিজ্যুয়ালাইজেশন করতে হয় তবে টি-এসএনই সম্ভবত আপনার পছন্দ হবে। প্রতিবেশী দূরত্ব সংরক্ষণ হিসাবে, আরও ভাল দর্শন জন্য ফলাফল করতে পারে।
ইয়ান্নিস Assael

2

[অটোরকোডারস] প্রাথমিকভাবে সুপ্ত স্থানের উপাত্তগুলির বৈচিত্র্য সর্বাধিককরণের দিকে মনোনিবেশ করে যার ফলস্বরূপ স্বয়ংক্রিয়কোডারগুলি বহুগুণ শিখার চেয়ে সুপ্ত স্পেসে ডেটার স্থানীয় কাঠামো ধরে রাখতে কম সফল ...

"স্থানীয় কাঠামো সংরক্ষণ করে একটি প্যারাম্যাট্রিক এম্বেডিং শেখা" থেকে, লরেন্স ভ্যান ডার ম্যাটেন ( https://lvdmaate.github.io/publications/papers/AISTATS_2009.pdf )


এটি "টি-এসএনই পেপার" নয়। স্ট্যান্ডার্ড টি-এসএনই অ-প্যারাম্যাট্রিক।
অ্যামিবা

1
এ সম্পর্কে আপনার মন্তব্যের জন্য @ অ্যামিবা ধন্যবাদ। আমি পোস্টটি সম্পাদনা করেছি।
ব্যবহারকারী 128525

1

অটেনকোডার এবং টি-এসএনই একত্রে হাই ডাইমেনশনাল ডেটাতে আরও ভাল ভিজ্যুয়ালাইজের জন্য ব্যবহার করা যেতে পারে, [1] এ বর্ণিত হিসাবে:

বিশেষত 2 ডি ভিজুয়ালাইজেশনের জন্য, টি-এসএনই সম্ভবত চারপাশের সেরা অ্যালগরিদম তবে এটি সাধারণত অপেক্ষাকৃত কম-মাত্রিক ডেটা প্রয়োজন। সুতরাং উচ্চ মাত্রিক ডেটাতে সাদৃশ্য সম্পর্কের দৃশ্যধারণের জন্য একটি ভাল কৌশলটি হ'ল একটি অটোরকোডার ব্যবহার করে আপনার ডেটাটিকে একটি নিম্ন-মাত্রিক স্থানে সংকুচিত করতে (উদাহরণস্বরূপ 32 ডাইমেনশনাল), তারপরে 2 ডি প্লেনে সংক্ষেপিত ডেটা ম্যাপিংয়ের জন্য টি-এসএনই ব্যবহার করুন to ।


[1] https://blog.keras.io/building-autoencoders-in-keras.html


0

অটেনকোডারটি পূর্ববর্তী উপাত্তগুলিকে 2-আদর্শ অর্থে সংরক্ষণের জন্য ডিজাইন করা হয়েছে, যা ডেটার গতিবেগ থাকলে ডেটার গতিবেগ শক্তি সংরক্ষণ হিসাবে বিবেচনা করা যেতে পারে।

টি-এসএনই করার সময়, কেএল ডাইভারজেন্সটি ব্যবহার করুন যা প্রতিসম নয়, এটি স্থানীয় কাঠামোর দিকে টি-এসএনই বেশি মনোযোগ দেবে, অন্যদিকে অটোয়েনকোডার সামগ্রিক এল 2 ত্রুটি ছোট রাখার ঝোঁক রাখে, যা বিশ্বব্যাপী।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.