যখন আমরা বলি হাইপারকিউবের বেশিরভাগ পয়েন্ট সীমানায় থাকে তখন এর অর্থ কী?


13

যদি আমার কাছে 50 টি মাত্রিক হাইপারকিউব থাকে। এবং আমি এর সীমানাটি বা দ্বারা সংজ্ঞায়িত করি যেখানে মাত্রা। তারপরে সীমানায় পয়েন্টগুলির অনুপাত গণনা করা হবে । এর মানে কী? এর অর্থ কি এই যে বাকি স্থানটি খালি আছে? যদি পয়েন্টস সীমানায় থাকে তবে কিউবের অভ্যন্তরে পয়েন্টগুলি সমানভাবে বিতরণ করা উচিত নয়?0<এক্স<0.050.95<এক্স<1এক্স0,99599%


3
না, এর অর্থ হল পরিধিটি আরও প্রশস্ত, এবং প্রভাবটি মাত্রিকতার সাথে সামঞ্জস্যপূর্ণ। এটি কিছুটা বিপরীত। আপনি যখন উচ্চ-মাত্রিক জায়গাগুলিতে নিকটবর্তী প্রতিবেশীদের ক্লাস্টার করতে বা গণনা করতে চান তখন প্রযোজ্য নোডগুলির মধ্যে এলোমেলো জোড়ার মধ্যকার দূরত্বের বিতরণে এই ঘটনার পরিণতি হয়।
এমরে 18

কোন রেখাংশের পয়েন্টগুলির অনুপাত এর সীমানার নিকটে রয়েছে তা গণনা করুন। তারপরে একটি স্কোয়ারে পয়েন্ট করুন। তারপরে একটি ঘনককে পয়েন্ট করুন। এগুলি সম্পর্কে আপনি কী বলতে পারেন?
ব্যবহারকারী 253751

উত্তর:


28

' হাইপারকিউবে পয়েন্টের 99% ' বলতে কিছুটা বিভ্রান্তিকর কারণ হাইপারকিউবে অসীম অনেকগুলি পয়েন্ট থাকে। পরিবর্তে ভলিউম সম্পর্কে কথা বলা যাক।

হাইপারকিউবের ভলিউম হল তার পাশের দৈর্ঘ্যের পণ্য। 50-মাত্রিক ইউনিট হাইপারক्यूबের জন্য আমরা

Total volume=1×1××150 times=150=1.

এখন আসুন হাইপারকিউবের সীমানা বাদ দিয়ে ' ইন্টিরিওর ' দেখুন (আমি এটি উদ্ধৃতি চিহ্নগুলিতে রেখেছি কারণ গাণিতিক শব্দটির অভ্যন্তরটির একটি আলাদা অর্থ রয়েছে)। আমরা কেবলমাত্র x=(x1,x2,,x50) পয়েন্টগুলি রাখি যা 0.05 < x 1 < 0.95 কে সন্তুষ্ট করে

0.05<এক্স1<0.95 এবং 0.05<এক্স2<0.95 এবং ... এবং 0.05<এক্স50<0.95।
এই 'অভ্যন্তর'এর আয়তন কত? ঠিক আছে, 'অভ্যন্তর' আবার একটি হাইপারকিউব এবং প্রতিটি পক্ষের দৈর্ঘ্য0.9 (=0.95-0.05 ... এটি দুটি এবং তিন মাত্রায় এটি কল্পনা করতে সহায়তা করে)। সুতরাং ভলিউম হয়
অভ্যন্তর পরিমাণ=0.9×0.9××0.950 বার=0.9500.005।
উপসংহার করুন যে 'সীমানা'এর ভলিউম('ছাড়াই ইউনিট হাইপারকিউব হিসাবে সংজ্ঞায়িত হয়েছে'অভ্যন্তর ') 1-0.9500,995।

এটি দেখায় যে 50-মাত্রিক হাইপারকিউবারের 99.5% ভলিউম তার ' সীমানা ' তে ঘনীভূত ।


ফলোআপ: ইগতিয়াস কীভাবে এটি সম্ভাবনার সাথে যুক্ত তা নিয়ে একটি আকর্ষণীয় প্রশ্ন উত্থাপন করেছে। এখানে একটি উদাহরণ।

বলুন আপনি এমন একটি (মেশিন লার্নিং) মডেল নিয়ে এসেছেন যা 50 ইনপুট পরামিতিগুলির উপর ভিত্তি করে আবাসন মূল্যগুলির পূর্বাভাস দেয়। সমস্ত 50 ইনপুট প্যারামিটার 0 এবং 1 এর মধ্যে স্বতন্ত্র এবং অভিন্নভাবে বিতরণ করা হয় ।01

আসুন আমরা বলি যে আপনার মডেলটি খুব ভাল কাজ করে যদি কোনও ইনপুট প্যারামিটার চূড়ান্ত না হয়: যতক্ষণ না প্রতিটি ইনপুট প্যারামিটার 0.05 এবং 0.95 মধ্যে থাকে , আপনার মডেল আবাসিক মূল্যের প্রায় পুরোপুরি পূর্বাভাস দেয়। তবে যদি এক বা একাধিক ইনপুট প্যারামিটারগুলি চরম হয় ( 0.05 চেয়ে ছোট বা 0.95 চেয়ে বড় ) তবে আপনার মডেলটির পূর্বাভাসগুলি একেবারেই ভয়ঙ্কর।

10%501-0.9500,995।99.5%

থাম্বের বিধি: উচ্চ মাত্রায় চরম পর্যবেক্ষণগুলি নিয়ম এবং ব্যতিক্রম নয়।


7
ওপি'র উদ্ধৃতিটি ব্যবহার করা মূল্যবান "এর অর্থ এই কি বাকি স্থানটি খালি আছে?" এবং উত্তর: না, এর অর্থ এই যে বাকি স্থানটি তুলনামূলকভাবে কম । । । বা আপনার নিজস্ব কথায় অনুরূপ। । ।
নিল স্লেটার

2
শব্দ "মাত্রা অভিশাপ" এর সত্যিই চমৎকার ব্যাখ্যা
Ignatius

নিম্নলিখিতগুলি সঠিক কিনা তা ভাবছেন: এই উদাহরণটি গ্রহণ করে যদি 50 টি মাত্রার প্রতিটি বৈশিষ্ট্যের একটি সেট [0,1] এর সাথে সমানভাবে বিতরণ করা হয় তবে ভলিউমের (99.5% -0.5%) = 99% (হাইপারকিউব বৈশিষ্ট্য) স্থান) প্রতিটি বৈশিষ্ট্য মাত্র 10% মান ধারন করে
Ignatius

"প্রদত্ত যে কোনও ইনপুট প্যারামিটার মাত্র 5% এর সম্ভাব্যতা সহ চরম।" আমি মনে করি এই সম্ভাবনা 10%।
রডভী

@ রদভি: আপনি অবশ্যই ঠিক বলেছেন, ধন্যবাদ! ঠিক কর.
ইলিয়াস স্ট্রেলে

9

আপনি নিম্ন মাত্রায় এমনকি প্যাটার্নটি পরিষ্কারভাবে দেখতে পারেন।

1 ম মাত্রা। 10 দৈর্ঘ্যের একটি লাইন এবং 1 এর সীমানা নিন the সীমাটির দৈর্ঘ্য 2 এবং অভ্যন্তরীণ 8, 1: 4 অনুপাত।

2 য় মাত্রা। পার্শ্ব 10 এর বর্গ এবং আরও একবার সীমানা নিন। সীমানার ক্ষেত্রফল 36, অভ্যন্তর 64, 9:16 অনুপাত।

তৃতীয় মাত্রা। একই দৈর্ঘ্য এবং সীমানা। সীমানার আয়তন 488, অভ্যন্তর 512, 61:64 - ইতিমধ্যে সীমানাটি অভ্যন্তরের প্রায় প্রায় স্থান দখল করে।

চতুর্থ মাত্রা, এখন সীমানা 5904 এবং অভ্যন্তর 4096 - সীমানা এখন আরও বড়।

এমনকি ছোট এবং আরও ছোট সীমানার দৈর্ঘ্যের জন্য, মাত্রা বাড়ায় সীমানার পরিমাণটি সর্বদা অভ্যন্তরকে ছাড়িয়ে যাবে overt


0

এটি "বোঝার" সর্বোত্তম উপায় (যদিও এটি কোনও মানুষের পক্ষে আইএমএইচও অসম্ভব) একটি এন-ডাইমেনশনাল বল এবং একটি এন-ডাইমেনশনাল ঘনক্ষেত্রের সাথে তুলনা করা। এন (মাত্রিকতা) এর বৃদ্ধির সাথে বলের সমস্ত ভলিউম "লিক আউট" হয় এবং কিউবের কোণে কেন্দ্রীভূত হয়। কোডিং তত্ত্ব এবং এর প্রয়োগগুলিতে মনে রাখার জন্য এটি একটি দরকারী সাধারণ নীতি।

এর সেরা পাঠ্যপুস্তকের ব্যাখ্যাটি রিচার্ড ডাব্লু হ্যামিংয়ের বই "কোডিং এবং তথ্য তত্ত্ব" (3.6 জ্যামিতিক পদ্ধতির, পি 44) এ রয়েছে।

উইকিপিডিয়া সংক্ষিপ্ত নিবন্ধে আপনি মনে রাখা সর্বদা একটি এন-মাত্রিক ইউনিট ঘনক্ষেত্র ভলিউম 1 ^ এন আপনি একই একটি সংক্ষিপ্ত সারাংশ দিতে হবে।

আমি আশা করি এটি সাহায্য করবে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.