ঠিক আছে, সুতরাং শিশুটির খেলনাগুলি গুচ্ছ করে দেওয়া উদাহরণটি বিশ্লেষণ করা যাক।
ভাবুন শিশুটির কেবল 3 টি খেলনা রয়েছে:
- একটি নীল ফুটবল বল
- একটি নীল freesbe
- একটি সবুজ ঘনক্ষেত্র (ঠিক আছে এটি আপনি কল্পনা করতে পারেন সবচেয়ে মজাদার খেলনা)
খেলনা কীভাবে তৈরি করা যায় সে সম্পর্কে নিম্নলিখিত প্রাথমিক অনুমানটি করা যাক:
- সম্ভাব্য রঙগুলি: লাল, সবুজ, নীল
- সম্ভাব্য আকারগুলি হ'ল: বৃত্ত, বর্গক্ষেত্র, ত্রিভুজ
এখন আমাদের কাছে (num_colors * num_shapes) = 3 * 3 = 9 সম্ভাব্য ক্লাস্টার থাকতে পারে।
ছেলেটি খেলনাগুলি গুচ্ছ করে রাখতেন:
- ক্লাস্টার এ) নীল বল এবং নীল রঙের ফ্রেসবিযুক্ত রয়েছে কারণ থাইয়ের রঙ এবং আকার একই রকম
- ক্লাস্টার বি) সুপার মজার সবুজ কিউব ধারণ করে
কেবলমাত্র এই 2 টি মাত্রা (রঙ, আকৃতি) ব্যবহার করে আমাদের কাছে 2 টি খালি ক্লাস্টার রয়েছে: সুতরাং এই প্রথম ক্ষেত্রে আমাদের 7/9 ~ 77% স্থান ফাঁকা।
এখন আসুন বাচ্চাকে যে পরিমাণ মাত্রাগুলি বিবেচনা করতে হবে তা বাড়িয়ে দিন। খেলনা কীভাবে তৈরি করা যায় সে সম্পর্কে আমরা নিম্নলিখিত অনুমানও করি:
- খেলনাটির আকার দশ সেন্টিমিটারের ধাপে কয়েক সেন্টিমিটার থেকে 1 মিটারের মধ্যে পরিবর্তিত হতে পারে: 0-10 সেমি, 11-20 সেমি, ..., 91 সেমি -1 মি
- খেলনাটির ওজন 100 কেজি: 0-100 গ্রাম, 101-200g, ..., 901g-1kg এর ধাপের সাথে 1 কেজি পর্যন্ত একইভাবে পরিবর্তিত হতে পারে।
এখনই যদি আমরা আমাদের খেলনাগুলিকে ক্লাস্টার করতে চাই তবে আমাদের কাছে (num_colors * num_shapes * num_sizes * num_weight) = 3 * 3 * 10 * 10 = 900 সম্ভাব্য ক্লাস্টার রয়েছে।
ছেলেটি খেলনাগুলি গুচ্ছ করে রাখতেন:
- ক্লাস্টার এ) নীল সকার বল ধারণ করে কারণ নীল এবং ভারী
- ক্লাস্টার বি) নীল এবং হালকা হ'ল নীল রঙের ফ্রাইস্বে রয়েছে
- ক্লাস্টার সি) সুপার-মজার সবুজ কিউব ধারণ করে
বর্তমান 4 টি মাত্রা (আকার, রঙ, আকার, ওজন) ব্যবহার করে কেবল 3 টি ক্লাস্টার খালি নয়: সুতরাং এই ক্ষেত্রে 897/900 ~ 99.7% স্থান খালি রয়েছে is
এটি আপনি উইকিপিডিয়ায় যা খুঁজে পান তার একটি উদাহরণ ( https://en.wikedia.org/wiki/Curse_of_d आया মতা ):
... মাত্রিকতা বৃদ্ধি পেলে স্থানের পরিমাণ এত দ্রুত বৃদ্ধি পায় যে উপলভ্য ডেটা বিচ্ছিন্ন হয়ে যায়।
সম্পাদনা: আমি নিশ্চিত নই যে আমি কোনও শিশুকে সত্যই ব্যাখ্যা করতে পারি যে মাঝেমধ্যে উচ্চ-মাত্রিক জায়গাগুলিতে দূরত্ব কেন ভুল হয়, তবে আসুন আমরা আমাদের শিশু এবং তার খেলনাগুলির উদাহরণ দিয়ে এগিয়ে যাওয়ার চেষ্টা করি।
কেবলমাত্র 2 টি প্রথম বৈশিষ্ট্যগুলি বিবেচনা করুন - রঙ, আকার} প্রত্যেকে সম্মত হন যে নীল বলটি সবুজ ঘনক্ষেত্রের তুলনায় নীল ফ্রিএসবের সাথে বেশি মিল।
এখন অন্যান্য 98 টি বৈশিষ্ট্য যুক্ত করা যাক {বলুন: আকার, ওজন, দিন_মুঠো_প্রডাকশন_এই_ টয়, উপাদান, স্নিগ্ধতা, দিন_যিনি_যে_তিনি_ওয়াসে_ভয়েড_বিডি_ড্যাডি, দাম ইত্যাদি}: ভাল, আমার কাছে কোন খেলনাটির সাথে মিল রয়েছে তা বিচার করা আরও বেশি কঠিন হয়ে উঠবে।
তাই:
- সংখ্যার নির্দিষ্ট তুলনা করে প্রচুর পরিমাণে বৈশিষ্ট্য অপ্রাসঙ্গিক হতে পারে, যার ফলে সংকেত-থেকে-শব্দ অনুপাতের দুর্নীতি দেখা দেয়।
- উচ্চ মাত্রায়, সমস্ত উদাহরণ "চেহারা-সমান"।
আপনি যদি আমার কথা শোনেন তবে একটি ভাল বক্তৃতাটি হ'ল "মেশিন লার্নিং সম্পর্কে জেনে রাখা কয়েকটি কার্যকর জিনিস" ( http://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf ), অনুচ্ছেদে particular নির্দিষ্টভাবে উপস্থাপন করা হয়েছে ধরণের যুক্তি
আশাকরি এটা সাহায্য করবে!