কল্পনা করুন যে আপনার কাছে কাঁচের প্লেটে একগুচ্ছ বীজ বেঁধেছে, যা টেবিলে অনুভূমিকভাবে বিশ্রাম নিচ্ছে। আমরা সাধারণত স্থান সম্পর্কে যেভাবে চিন্তা করি, সে কারণে এটি নিরাপদ হবে যে এই বীজগুলি কম-বেশি দ্বি-মাত্রিক স্থানে বাস করে, কারণ প্রতিটি বীজ দুটি সংখ্যার দ্বারা চিহ্নিত করা যায় যা বীজের পৃষ্ঠতলের স্থানাঙ্ক দেয় কাচটি.
এখন কল্পনা করুন যে আপনি প্লেটটি নিয়েছেন এবং এটিকে ত্রিভুজটি উপরের দিকের দিকে কাত করুন, যাতে কাচের পৃষ্ঠটি মাটির সাথে সম্মানের সাথে আর অনুভূমিক না হয়। এখন, আপনি যদি একটি বীজ সনাক্ত করতে চান তবে আপনার কাছে কয়েকটি বিকল্প রয়েছে। আপনি যদি গ্লাসটিকে উপেক্ষা করার সিদ্ধান্ত নেন, তবে প্রতিটি বীজ টেবিলের উপরে ত্রি-মাত্রিক জায়গায় ভাসমান বলে মনে হবে এবং তাই আপনাকে প্রতিটি বীজের অবস্থান তিনটি সংখ্যা ব্যবহার করে প্রতিটি স্থানিক দিকের জন্য বর্ণনা করতে হবে। তবে কেবল গ্লাসটি কাত করে আপনি এই সত্যটি পরিবর্তন করেননি যে বীজগুলি এখনও দ্বিমাত্রিক পৃষ্ঠের উপরে বাস করে। সুতরাং আপনি কীভাবে কাচের পৃষ্ঠতলটি ত্রিমাত্রিক স্থানে অবস্থিত তা বর্ণনা করতে পারেন এবং তারপরে আপনি গ্লাসের বীজের অবস্থানগুলি আপনার মূল দুটি মাত্রা ব্যবহার করে বর্ণনা করতে পারেন।
এই চিন্তাধারার পরীক্ষায়, কাচের পৃষ্ঠটি নিম্ন-মাত্রিক বহুগুণের সমান যা একটি উচ্চ মাত্রিক স্থানে বিদ্যমান: আপনি প্লেটটি তিনটি মাত্রায় কীভাবে ঘোরান তা বিবেচনা না করে, বীজগুলি এখনও দ্বি-মাত্রিক বিমানের পৃষ্ঠের পাশে বাস করে।
উদাহরণ
আরও সাধারণভাবে, একটি উচ্চ-মাত্রিক জায়গাতে এমবেড করা একটি নিম্ন-মাত্রিক বহুগুণ কেবলমাত্র পয়েন্টগুলির একটি সেট যা যে কারণেই হোক না কেন, সংযুক্ত হিসাবে বিবেচনা করা হয় বা একই সেটের অংশ হিসাবে বিবেচিত হয়। উল্লেখযোগ্যভাবে, বহুগুণ একরকম উচ্চ-মাত্রিক স্থানে সংযুক্ত করা যেতে পারে (উদাহরণস্বরূপ, সম্ভবত কাচের পৃষ্ঠটি একটি প্লেটের আকারের পরিবর্তে একটি বাটি আকারে আবৃত করা হয়), তবে বহুগুণ এখনও মূলত নিম্ন-মাত্রিক। বিশেষত উচ্চ-মাত্রিক স্থানে, এই বহুগুণ অনেকগুলি বিভিন্ন রূপ এবং আকার নিতে পারে, তবে আমরা ত্রি-মাত্রিক বিশ্বে বাস করি, তাই তিনটি মাত্রার বেশি যে উদাহরণ রয়েছে তা কল্পনা করা কঠিন। যেমন একটি নমুনা হিসাবে, এই উদাহরণগুলি বিবেচনা করুন:
- শারীরিক স্থানের একটি কাচের টুকরো (পরিকল্পনাকারী, দ্বি-মাত্রিক) (ত্রিমাত্রিক)
- একক থ্রেড (এক-মাত্রিক) এক টুকরো কাপড়ের (দ্বিমাত্রিক)
- এক টুকরো কাপড় (দ্বি-মাত্রিক) ওয়াশিং মেশিনে চূর্ণবিচূর্ণ (ত্রিমাত্রিক)
মেশিন লার্নিংয়ে ম্যানিফোল্ডগুলির সাধারণ উদাহরণগুলিতে (বা কম-মাত্রিক সেটগুলি যা নিম্ন-মাত্রিক ম্যানিফোল্ডগুলি ধরে বাস করার জন্য অনুমান করা হয়) এর মধ্যে রয়েছে:
- প্রাকৃতিক দৃশ্যের চিত্রসমূহ (সাধারণত আপনি সাদা শব্দের চিত্র দেখতে পাচ্ছেন না, উদাহরণস্বরূপ, "প্রাকৃতিক" চিত্রগুলি পিক্সেল কনফিগারেশনের পুরো জায়গা দখল করে না)
- প্রাকৃতিক শব্দ (অনুরূপ যুক্তি)
- মানব আন্দোলন (মানবদেহে শত শত ডিগ্রি স্বাধীনতা রয়েছে, তবে নড়াচড়া এমন জায়গায় বাস করে যা appear 10 মাত্রা ব্যবহার করে কার্যকরভাবে প্রতিনিধিত্ব করা যেতে পারে)
বহুগুণ শিখছি
মেশিন লার্নিংয়ের বহুবিধ অনুমানটি হ'ল, পৃথিবীর তথ্য সম্ভাব্য স্থানের প্রতিটি অংশ থেকে আসতে পারে এমনটা ধরে নেওয়ার পরিবর্তে (যেমন, সাদা গোলমাল সহ সমস্ত সম্ভাব্য 1-মেগাপিক্সেল চিত্রের স্থান), ধরে নেওয়া আরও বেশি অর্থবোধ করে প্রশিক্ষণের ডেটা তুলনামূলকভাবে নিম্ন-মাত্রিক ম্যানিফোল্ডগুলি (বীজের সাথে কাচের প্লেটের মতো) থেকে আসে। তারপরে বহুগুণের কাঠামো শেখা একটি গুরুত্বপূর্ণ কাজ হয়ে যায়; অতিরিক্ত হিসাবে, লেবেলযুক্ত প্রশিক্ষণের ডেটা ব্যবহার না করে এই শেখার কাজটি সম্ভব বলে মনে হচ্ছে।
নিম্ন-মাত্রিক বহুগুণের কাঠামো শেখার অনেকগুলি বিভিন্ন উপায় রয়েছে। সর্বাধিক ব্যবহৃত পদ্ধতির একটি হ'ল পিসিএ, যা ধরে নিয়েছে যে বহুগুণে একটি প্যানকেক বা সিগার আকৃতির মতো একক উপবৃত্তাকার "ব্লব" রয়েছে, যা উচ্চতর মাত্রায় স্থান ধারণ করে। আইসোম্যাপ, আইসিএ বা স্পার কোডিংয়ের মতো আরও জটিল কৌশল বিভিন্ন উপায়ে এই অনুমানগুলিকে কিছুটা শিথিল করে।
আধা তত্ত্বাবধানে শেখা
আধা তত্ত্বাবধানে শেখার ক্ষেত্রে বহুগুণ অনুমানের কারণ দ্বিগুণ। অনেক বাস্তববাদী কাজের জন্য (উদাহরণস্বরূপ, কোনও চিত্রের পিক্সেলগুলি 4 বা 5 দেখায় কিনা তা নির্ধারণ করে) বিশ্বে লেবেল ছাড়াই বিশ্বে আরও অনেক বেশি ডেটা পাওয়া যায় (উদাহরণস্বরূপ, চিত্রগুলিতে অঙ্ক থাকতে পারে) এর চেয়ে লেবেল (যেমন, চিত্রগুলি যা স্পষ্টভাবে "4" বা "5" লেবেলযুক্ত)। ইমেজগুলির লেবেলগুলির তুলনায় চিত্রগুলির পিক্সেলগুলিতে চিত্রের পিক্সেলগুলিতে আরও বহু পরিমাণের আরও অর্ডার পাওয়া যায়। তবে, যেমনটি আমি উপরে বর্ণিত করেছি, প্রাকৃতিক চিত্রগুলি প্রকৃত চিত্রগুলি পিক্সেল কনফিগারেশনের তুলনায় অভিন্ন বিতরণ থেকে নমুনাযুক্ত নয়, সুতরাং সম্ভবত এমন মনে হয় যে প্রাকৃতিক চিত্রগুলির কাঠামোটি ক্যাপচার করে এমন কিছু বহুগুণ রয়েছে।ম্যানিফোল্ড, যখন 5 এস সমন্বিত চিত্রগুলি একইভাবে আলাদা তবে কাছের বহুগুণে থাকে, তবে আমরা কেবলমাত্র পিক্সেল ডেটা ব্যবহার করে এই ম্যানিফোল্ডগুলির প্রত্যেকটির জন্য উপস্থাপনা বিকাশের চেষ্টা করতে পারি, আশা করি যে ডেটার বিভিন্ন বিদিত বৈশিষ্ট্যগুলি ব্যবহার করে বিভিন্ন ম্যানিফোল্ডগুলি প্রতিনিধিত্ব করা হবে। তারপরে, পরে, যখন আমাদের কাছে কয়েকটি বিট লেবেল ডেটা উপলব্ধ থাকে, আমরা সেই বিটগুলি কেবলমাত্র ইতিমধ্যে চিহ্নিত ম্যানিফোল্ডগুলিতে লেবেল প্রয়োগ করতে পারি।
এই ব্যাখ্যাটির বেশিরভাগটি গভীর এবং বৈশিষ্ট্য শেখার সাহিত্যের কাজ থেকে আসে। যোশুয়া বেনজিও এবং ইয়ান লেকুন - দেখুন এনার্জি বেসড লার্নিং টিউটোরিয়ালটির বিশেষত এই ক্ষেত্রে অ্যাক্সেসযোগ্য যুক্তি রয়েছে।