প্রশ্ন
আমি ল্যাপ্লাসিয়ান ইজেনম্যাপস পদ্ধতিতে খুব আগ্রহী। বর্তমানে, আমি আমার মেডিকেল ডেটা সেটগুলিতে মাত্রা হ্রাস করতে এটি ব্যবহার করছি।
যাইহোক, আমি পদ্ধতিটি ব্যবহার করে একটি সমস্যায় পড়েছি।
উদাহরণস্বরূপ, আমার কাছে কিছু ডেটা (স্পেকট্রা সিগন্যাল) রয়েছে এবং আমি কিছু পিসি (বা আইসি) পেতে পিসিএ (বা আইসিএ) ব্যবহার করতে পারি। সমস্যাটি কীভাবে এলই ব্যবহার করে মূল ডেটার অনুরূপ মাত্রা হ্রাস করা উপাদানগুলি পাবেন?
ল্যাপ্লাসিয়ান ইগিনাম্যাপস পদ্ধতি অনুসারে, আমাদের সাধারণীকৃত ইগেনুয়ালু সমস্যাটি সমাধান করা দরকার যা হ'ল
এখানে হ'ল ইগেনভেেক্টর। যদি আমি উদাহরণস্বরূপ শীর্ষস্থানীয় 3 টি আইজেনভেেক্টর (3 ইগেনভ্যালু অনুসারে সমাধান) প্লট করি তবে ফলাফলগুলি ব্যাখ্যাযোগ্য নয়।
যাইহোক, আমি যখন শীর্ষ 3 পিসি এবং শীর্ষ 3 আইসি প্লট করি তখন ফলাফলগুলি সর্বদা স্পষ্টভাবে (দৃষ্টিভঙ্গি) মূল ডেটা উপস্থাপন করে বলে মনে হয় ।
আমি ধরে নিচ্ছি কারণ কারণ ম্যাট্রিক্স ওজন ম্যাট্রিক্স দ্বারা সংজ্ঞায়িত করা হয় (অ্যাডজেসেন্সি ম্যাট্রিক্স) ), এবং ডেটা তৈরি করতে তাপের কার্নেলটি লাগানো হয়েছে , যা একটি ঘনিষ্ঠ ফাংশন ব্যবহার করছে। আমার প্রশ্ন হ'ল এর হ্রাস উপাদানগুলি কীভাবে পুনরুদ্ধার করবেন (আইজেনভেেক্টর নয় ম্যাট্রিক্স এর )?
উপাত্ত
আমার ডেটাসেটটি সীমাবদ্ধ এবং সমস্যাটি দেখানো সহজ নয়। আমি কী বোঝাতে চাই এবং কী জিজ্ঞাসা করতে চাই তা বোঝাতে এখানে খেলনার সমস্যা তৈরি করেছি।
ছবিটি দেখুন,
প্রথমত, আমি কয়েকটি বাঁকা তরঙ্গগুলি এ, বি, সি লাল বক্ররেখাতে দেখি (চিত্রের প্রথম কলাম) তৈরি করি। A, B এবং C এর 1000 টি নমুনা রয়েছে, অন্য কথায়, 1x1000 ভেক্টরগুলিতে সংরক্ষণ করা হয়েছে।
দ্বিতীয়ত, আমি এ, বি, সি উত্স মিশ্রিত করে এলোমেলোভাবে তৈরি লিনিয়ার সংমিশ্রণগুলি ব্যবহার করে, যেমন, , যা এলোমেলো মান। মিশ্র সংকেত খুব উচ্চ মাত্রার স্থান, যেমন, , 1517 এলোমেলোভাবে উচ্চ মাত্রিক স্থান বেছে নেওয়া হয়েছে। আমি কেবল প্রথম তিনটি সারি সংকেত এম সবুজ বক্ররেখা (চিত্রের দ্বিতীয় কলাম) এ দেখায়।
এরপরে, আমি মাত্রা হ্রাস ফলাফল পেতে পিসিএ, আইসিএ এবং ল্যাপ্লেসিয়ান ইগেনাম্যাপগুলি চালিত করি। আমি একটি সুষ্ঠু তুলনা করতে 3 টি পিসি, 3 আইসি এবং 3 এলইএস ব্যবহার করতে পছন্দ করেছি (নীল বক্ররেখা যথাক্রমে তৃতীয়, চতুর্থ এবং চিত্রের শেষ কলাম হিসাবে দেখানো হয়েছে)।
পিসিএ এবং আইসিএ (চিত্রের তৃতীয়, চতুর্থ কলাম) এর ফলাফল থেকে আমরা দেখতে পাচ্ছি যে আমরা ফলাফলগুলি কিছু মাত্রা হ্রাস হিসাবে ব্যাখ্যা করতে পারি, অর্থাৎ আইসিএ ফলাফলের জন্য, আমরা মিশ্র সংকেতটি পুনরুদ্ধার করতে পারি (আমরাও পেতে পারি কিনা তা নিশ্চিত নই পিসিএ ফলাফল সহ তবে ফলাফলটি আমার পক্ষে বেশ সঠিক বলে মনে হচ্ছে)।
তবে, দয়া করে এলই এর ফলাফলগুলি দেখুন, আমি সবেই ফলাফলগুলি ব্যাখ্যা করতে পারি (চিত্রের শেষ কলাম)। এটি হ্রাসকারী উপাদানগুলির সাথে কিছু 'ভুল' বলে মনে হচ্ছে। এছাড়াও, আমি উল্লেখ করতে চাই যে শেষ পর্যন্ত শেষ কলামের প্লটটি আইজেনভেেক্টর সূত্রে
আপনারা কি আরও ধারণা পেয়েছেন?
চিত্র 1 হিটিং কার্নেলের নিকটস্থ নিকটতম 12 প্রতিবেশী এবং সিগমা ব্যবহার করে 0.5:
চিত্র 2 হিটিং কার্নেলে 1000 নিকটতম প্রতিবেশী এবং সিগমা ব্যবহার করে 0.5:
Sourcecode: প্রয়োজনীয় প্যাকেজের সাথে মতলব কোড