মাত্রিকতার অভিশাপ কি?


21

বিশেষত, আমি রেফারেন্সগুলি (কাগজপত্র, বই) খুঁজছি যা কঠোরভাবে মাত্রিকতার অভিশাপটি প্রদর্শন করবে এবং ব্যাখ্যা করবে। আমি এই সাদা কাগজটি লাফার্টি এবং ওয়াসারম্যান দ্বারা পড়া শুরু করার পরে এই প্রশ্নটি উত্থাপিত হয়েছিল । তৃতীয় অনুচ্ছেদে তারা একটি "সুপরিচিত" সমীকরণের উল্লেখ করেছেন যা বোঝায় যে রূপান্তরটির সেরা হারটি ; যদি কেউ এটিকে ব্যাখ্যা করতে (এবং এটি ব্যাখ্যা করতে) পারেন তবে এটি খুব সহায়ক হবে।n4/(4d)

এছাড়াও, কেউ কি আমাকে এমন একটি উল্লেখের দিকে নির্দেশ করতে পারেন যা "সুপরিচিত" সমীকরণটি পেয়েছে?


7
আমি ব্যাখ্যা করতে পারি না, তবে আমি বিশ্বাস করি যে শাপের তিনটি পৃথক সংস্করণের মতো শব্দটি আমি শুনেছি: 1) উচ্চতর মাত্রার অর্থ একটি তাত্পর্যপূর্ণ-বর্ধমান কাজের পরিমাণ, এবং 2) উচ্চ মাত্রায় আপনি কোনও অংশে কম এবং কম উদাহরণ পাবেন আপনার নমুনা স্পেস এবং 3) উচ্চ মাত্রায় সমস্ত কিছু মূলত সুস্পষ্ট-দূরবর্তী হতে থাকে যেকোন পার্থক্য করা শক্ত করে তোলে।
ওয়েইন

5
আপনি এই জ্যামিতিকভাবে ব্যাখ্যা করতে পারে। বলুন যে আপনি ব্যাসার্ধ r = 1 দিয়ে ডি মাত্রায় একটি গোলক পেয়েছেন। তারপরে আপনি গোলকটির পরিমাণকে ভগ্নাংশের ভগ্নাংশের কতটা ভগ্নাংশ যা r = 1 এবং r = 1-e এর মধ্যে থাকে তা প্রশ্ন করতে পারেন। যেহেতু আমরা জানি যে একটি গোলকের পরিমাণগুলি কে (ডি) * আর ^ (ডি) এর মতো, যেখানে d মাত্রাগুলির সংখ্যা, আমরা অনুমান করতে পারি যে ভগ্নাংশটি 1- (1-e) ^ d দ্বারা দেওয়া হয়েছে। সুতরাং, উচ্চ মাত্রিক গোলকগুলির জন্য বেশিরভাগ ভলিউম পৃষ্ঠের কাছাকাছি একটি পাতলা শেলের মধ্যে ঘন করা হয়। বিশপস বইটিতে এটি সম্পর্কে আরও দেখুন "প্যাটার্নের স্বীকৃতি এবং মেশিন লার্নিং"।
ডঃ মাইক

@ ওয়াইন শিওর; আরও 5) বেশি ম্লানির অর্থ সাধারণত বেশি শব্দ হয়।

ডঃ মাইক, আমি যুক্তি অনুসরণ করি না। মনে হচ্ছে আপনি বলছেন যে "যেহেতু বেশিরভাগ ভলিউম উচ্চ মাত্রিক গোলকের পৃষ্ঠের কাছাকাছি একটি পাতলা শেলের মধ্যে ঘন করা হয়েছে, তারপরে আপনি মাত্রিকতার সাথে অভিশাপিত হয়েছেন।" আপনি আরও ব্যাখ্যা করতে পারেন, এবং সম্ভবত স্পষ্ট করে আমাকে দেখাতে পারেন যে পরিসংখ্যানগুলির সাথে কীভাবে সাদৃশ্য রয়েছে?
খোদা

উত্তর:


9

সমৃদ্ধিযুক্ত মাইক্রোস্রোয়ে অনুসরণ করে, এখানে পরিসংখ্যান শিক্ষার উপাদানগুলির অধ্যায় 2 (পিপি 22-27) এর প্রাসঙ্গিক চিত্রটি দেওয়া হয়েছে :

ESL পৃষ্ঠা 25

আপনি উপরের ডান দিকের ফলকে দেখতে পাচ্ছেন, 2 মাত্রায় 1 ইউনিট দূরে প্রতিবেশী থাকার চেয়ে 1 মাত্রায় 1 ইউনিট দূরে বেশি প্রতিবেশী রয়েছে। 3 মাত্রা আরও খারাপ হবে!


7

এটি আপনার প্রশ্নের সরাসরি জবাব দেয় না, তবে ডেভিড ডোনহোর হাই-ডাইমেনশনাল ডেটা অ্যানালাইসিসের উপর একটি সুন্দর নিবন্ধ রয়েছে : অভিশাপের অভিশাপ এবং আশীর্বাদ (সম্পর্কিত স্লাইডগুলি এখানে রয়েছে ), যেখানে তিনি তিনটি অভিশাপের কথা উল্লেখ করেছেন:

  • এক্সহসটিভ অনুসন্ধানের মাধ্যমে অপ্টিমাইজেশন : "যদি আমাদের প্রায় ভেরিয়েবলগুলির কোনও ক্রিয়াকে অনুকূলিত করতে হয় এবং আমরা এটি কেবল লিপস্টিটসই জানি তবে বলুন, একটি আনুমানিক মিনিমাইজার পাওয়ার জন্য আমাদের গ্রিডে অর্ডার মূল্যায়ন প্রয়োজন ত্রুটি- ।( 1 / ε ) ডি εD(1/ϵ)Dϵ
  • পণ্য ডোমেনগুলির সাথে একীকরণ : "যদি আমাদের অবশ্যই ভেরিয়েবলগুলির কোনও ক্রিয়াকলাপ সংহত করতে হয় এবং আমরা কেবল এটিই জানি যে এটি লিপস্টিটস, তবে বলুন, তবে আমাদের সাথে একটি ইন্টিগ্রেশন স্কিম পেতে গ্রিডে অর্ডার মূল্যায়ন প্রয়োজন need ত্রুটি "( 1 / ε ) ডি εd(1/ϵ)Dϵ
  • উচ্চ-মাত্রিক ডোমেনগুলির উপর অনুমানকরণ : "যদি আমাদের অবশ্যই ভেরিয়েবলগুলির কোনও ফাংশন আনুমানিক করতে হয় এবং আমরা কেবল এটি লিপস্টিটসই জানি, তবে বলুন, অনুমানের জন্য একটি গ্রিডে আমাদের অর্ডার মূল্যায়ন প্রয়োজন ইউনিফর্ম আনুমানিক ত্রুটি সহ স্কিম ""( 1 / ε ) ডি εD(1/ϵ)Dϵ

6

আমি জানি যে আমি এটি উল্লেখ করে চলেছি , তবে এটির একটি দুর্দান্ত ব্যাখ্যা হ'ল পরিসংখ্যান শিক্ষার উপাদানসমূহ , অধ্যায় 2 (পিপি 22-27)। তারা মূলত নোট করে যে মাত্রাগুলি বৃদ্ধি পাওয়ার সাথে সাথে এটির সাথে ডেটার পরিমাণ বাড়তে হবে (তাত্ক্ষণিকভাবে) বা কোনও কার্যকর বিশ্লেষণ করার জন্য বৃহত্তর নমুনার জায়গাতে পর্যাপ্ত পয়েন্ট থাকবে না।

তারা বেলম্যান (১৯61১) এর একটি কাগজকে তাদের উত্স হিসাবে উল্লেখ করেছেন, যা এখানে অ্যামাজন থেকে পাওয়া তাঁর বই অ্যাডাপিটিভ কন্ট্রোল প্রসেস হিসাবে উপস্থিত বলে মনে হয় here


+1 টি। ইএসএলে ব্যাখ্যাটি দুর্দান্ত এবং সম্পর্কিত ডায়াগ্রামগুলি অনেক সাহায্য করে।
Zach

2

এখানে চিত্র বর্ণনা লিখুন

হতে পারে সর্বাধিক কুখ্যাত প্রভাব নীচের সীমা (যা (পরোক্ষভাবে) উপরের ছবিতে চিত্রিত) দ্বারা ধরা পড়ে:

limdimdistmaxdistmindistmin

ছবিতে দূরত্ব ভিত্তিক euclidian দূরত্ব। সীমাটি প্রকাশ করে যে দূরত্বের ধারণাটি মাত্রিকতার বৃদ্ধির সাথে মিলের জন্য কম এবং কম তথ্যকে ক্যাপচার করে। এটি কে-এনএন এর মতো অ্যালগরিদমগুলিকে প্রভাবিত করে। -norms এ এর জন্য ভগ্নাংশের অনুমতি দিয়ে বর্ণিত প্রভাবকে সংশোধন করা যেতে পারেকে এল কেL2kLk


ছবিতে ডেটা উপর মাত্রা প্রভাব

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.