আপনি বিভ্রান্ত হওয়ার সাথে সাথে আমাকে সমস্যাটি উল্লেখ করে এবং আপনার প্রশ্নগুলি একে একে নেওয়া শুরু করুন। আপনি 10,000 একটি নমুনা আকার আছে এবং প্রতিটি নমুনা একটি বৈশিষ্ট্য ভেক্টর দ্বারা বর্ণনা করা হয়েছে । যদি আপনি গাউসিয়ান রেডিয়াল ভিত্তিক ফাংশনগুলি ব্যবহার করে রিগ্রেশন করতে চান তবে যেখানে আপনার ভিত্তি ফাংশন আছে। বিশেষত, আপনাকে ওয়েট যাতে প্রদত্ত প্যারামিটারগুলির জন্য এবং আপনি এবং এর সাথে সম্পর্কিত পূর্বাভাস = মধ্যে ত্রুটিটি হ্রাস করুন চ ( এক্স ) = Σ ঞ W ঞ * ছ ঞ ( এক্স ; μ ঞ , σ ঞ ) , ঞ = 1 .. মি গ্রাম আমি আছি W ঞ μ ঞ σ ঞ Y Y চ ( এক্স )x∈R31
f(x)=∑jwj∗gj(x;μj,σj),j=1..m
gimwjμjσjyy^f(x^) - সাধারণত আপনি সর্বনিম্ন স্কোয়ার ত্রুটি কমিয়ে আনবেন।
মু সাবস্ক্রিপ্ট জে প্যারামিটারটি ঠিক কী?
আপনার বেস ফাংশন । (আপনাকে এখনও সংখ্যা নির্ধারণ করতে হবে ) প্রতিটি ভিত্তিতে একটি এবং একটি (এছাড়াও অজানা)। সাবস্ক্রিপ্ট থেকে রেঞ্জ থেকে ।গ্রাম ঞ মি μ ঞ σ ঞ ঞ 1 মিmgjmμjσjj1m
কি ভেক্টর?μj
হ্যাঁ, এটা একটি বিন্দু হল । অন্য কথায়, এটি আপনার বৈশিষ্ট্যের জায়গার কোথাও পয়েন্ট এবং প্রতিটি বেস ফাংশনগুলির জন্য একটি নির্ধারিত করতে হবে । μমিR31μm
আমি পড়েছি যে এটি ভিত্তি ফাংশনগুলির অবস্থানগুলি পরিচালনা করে। সুতরাং এটি কি কোনও কিছুর অর্থ নয়?
ভিত্তিতে ফাংশন কেন্দ্রীভূত হয় । এই অবস্থানগুলি কোথায় তা আপনাকে সিদ্ধান্ত নিতে হবে। সুতরাং না, এটি অগত্যা কোনও কিছুর অর্থ নয় (তবে এটি নির্ধারণের উপায়গুলির জন্য আরও নীচে দেখুন) μ jjthμj
এখন সিগমার জন্য যা "স্থানিক স্কেল পরিচালনা করে"। আসলে কি?
σ বুঝতে সহজ হয় যদি আমরা তাদের ভিত্তিতে ফাংশনগুলি চালু করি।
এটি কম dimensons মধ্যে গসিয়ান রশ্মীয় ভিত্তিতে ফাংশন ভাবলে বলতে সাহায্য করে বা । In এ গাউসীয় রেডিয়াল ভিত্তিক কার্যটি কেবলমাত্র বেল বক্ররেখা। বেলটি অবশ্যই সংকীর্ণ বা প্রশস্ত হতে পারে। প্রস্থটি দ্বারা নির্ধারিত হয় - বৃহত্তর হ'ল বেল আকারটি সংকীর্ণ করে। অন্য কথায়, বেল আকারের প্রস্থকে স্কেল করে। সুতরাং = 1 এর জন্য আমাদের কোনও স্কেলিং নেই। বৃহত আমাদের যথেষ্ট পরিমাণে স্কেলিং রয়েছে।আর 2 আর 1 σσσσσR1R2R1σσσσσ
আপনি জিজ্ঞাসা করতে পারেন এর উদ্দেশ্য কী। যদি আপনি ঘণ্টা জায়গার কিছু অংশ ( একটি লাইন ) কভার করে মনে করেন - একটি সরু বেলটি কেবল রেখার একটি ছোট অংশকেই coverেকে রাখবে। কেন্দ্রের নিকটে থাকা পয়েন্ট বৃহত্তর মান হবে। কেন্দ্র থেকে দূরে অবস্থিত পয়েন্টগুলির একটি ছোট মান হবে। স্কেলিংয়ের কেন্দ্র থেকে আরও বেশি এগিয়ে যাওয়ার পয়েন্টগুলির প্রভাব রয়েছে - বেল সঙ্কুচিত পয়েন্টগুলি কেন্দ্র থেকে আরও অবস্থিত হবে - এর মান হ্রাস করবে x g j (x) g j (x) g j (x)R1xgj(x)gj(x)gj(x)
প্রতিটি বেস ফাংশন ইনপুট ভেক্টর এক্সকে একটি মাপকে মান হিসাবে রূপান্তর করে
হ্যাঁ, আপনি কিছু সময়ে ভিত্তিতে ফাংশন মূল্যায়ন করা হয় ।x∈R31
exp(−∥x−μj∥222∗σ2j)
ফলস্বরূপ আপনি একটি স্কেলার পান। স্কেলারের ফলাফল প্রদত্ত কেন্দ্র থেকে point point পয়েন্টের দূরত্বের উপর নির্ভর করে এবং স্কেলার ।xμj∥x−μj∥σj
আমি কিছু বাস্তবায়ন দেখেছি যা এই পরামিতিটির জন্য .1, .5, 2.5 এর মতো মানগুলি চেষ্টা করে। এই মানগুলি কীভাবে গণনা করা হয়?
এটি অবশ্যই গাউসীয় রেডিয়াল বেস ফাংশনগুলি ব্যবহার করার একটি আকর্ষণীয় এবং কঠিন দিক। আপনি যদি ওয়েব অনুসন্ধান করেন তবে এই পরামিতিগুলি কীভাবে নির্ধারিত হয় সে সম্পর্কে আপনি অনেকগুলি পরামর্শ পাবেন। ক্লাস্টারিংয়ের উপর ভিত্তি করে আমি খুব সাধারণ পদগুলিতে একটি সম্ভাবনা রূপরেখা করব। আপনি এটি এবং অন্যান্য বেশ কয়েকটি পরামর্শ অনলাইনে খুঁজে পেতে পারেন।
আপনার 10000 নমুনা ক্লাস্টারিং দিয়ে শুরু করুন (কে-মিনস ক্লাস্টারিংয়ের পরে মাত্রাগুলি হ্রাস করতে আপনি প্রথমে পিসিএ ব্যবহার করতে পারেন)। আপনি দিতে পারেন আপনাকে খুঁজে (সাধারণত সেরা নির্ধারণ ক্রস বৈধতা নিযুক্ত ক্লাস্টার সংখ্যা হতে )। এখন, প্রতিটি ক্লাস্টারের জন্য একটি রেডিয়াল বেস ফাংশন তৈরি করুন । প্রতিটি রেডিয়াল ভিত্তিক ফাংশনটির জন্য ক্লাস্টারের কেন্দ্র (যেমন গড়, সেন্ট্রয়েড, ইত্যাদি) হওয়া উচিত। যাক ক্লাস্টারের প্রস্থ (উদাঃ ব্যাসার্ধ ...) এখন এগিয়ে যান এবং আপনার প্রতিরোধ সম্পাদন করুন (এই সাধারণ বিবরণটি কেবল একটি ওভারভিউ- এটি প্রতিটি পদক্ষেপে প্রচুর কাজ প্রয়োজন!)mmgjμjσj
* অবশ্যই, বেলের বক্ররেখাকে সংজ্ঞায়িত করা হয় - থেকে সুতরাং লাইনের যে কোনও জায়গায় মান হবে। তবে, কেন্দ্র থেকে দূরের মানগুলি নগন্য l∞∞