পিসিএ, আইসিএ এবং ল্যাপ্লেসিয়ান ইগেনম্যাপস


11

প্রশ্ন

আমি ল্যাপ্লাসিয়ান ইজেনম্যাপস পদ্ধতিতে খুব আগ্রহী। বর্তমানে, আমি আমার মেডিকেল ডেটা সেটগুলিতে মাত্রা হ্রাস করতে এটি ব্যবহার করছি।

যাইহোক, আমি পদ্ধতিটি ব্যবহার করে একটি সমস্যায় পড়েছি।

উদাহরণস্বরূপ, আমার কাছে কিছু ডেটা (স্পেকট্রা সিগন্যাল) রয়েছে এবং আমি কিছু পিসি (বা আইসি) পেতে পিসিএ (বা আইসিএ) ব্যবহার করতে পারি। সমস্যাটি কীভাবে এলই ব্যবহার করে মূল ডেটার অনুরূপ মাত্রা হ্রাস করা উপাদানগুলি পাবেন?

ল্যাপ্লাসিয়ান ইগিনাম্যাপস পদ্ধতি অনুসারে, আমাদের সাধারণীকৃত ইগেনুয়ালু সমস্যাটি সমাধান করা দরকার যা হ'ল

Ly=λDy

এখানে yহ'ল ইগেনভেেক্টর। যদি আমি উদাহরণস্বরূপ শীর্ষস্থানীয় 3 টি আইজেনভেেক্টর (3 ইগেনভ্যালু অনুসারে সমাধান) প্লট করি তবে ফলাফলগুলি ব্যাখ্যাযোগ্য নয়।

যাইহোক, আমি যখন শীর্ষ 3 পিসি এবং শীর্ষ 3 আইসি প্লট করি তখন ফলাফলগুলি সর্বদা স্পষ্টভাবে (দৃষ্টিভঙ্গি) মূল ডেটা উপস্থাপন করে বলে মনে হয় x

আমি ধরে নিচ্ছি কারণ কারণ ম্যাট্রিক্স L ওজন ম্যাট্রিক্স দ্বারা সংজ্ঞায়িত করা হয় (অ্যাডজেসেন্সি ম্যাট্রিক্স) W), এবং ডেটা x তৈরি করতে তাপের কার্নেলটি লাগানো হয়েছে W, যা একটি ঘনিষ্ঠ ফাংশন ব্যবহার করছে। আমার প্রশ্ন হ'ল এর হ্রাস উপাদানগুলি কীভাবে পুনরুদ্ধার করবেনx (আইজেনভেেক্টর নয় y ম্যাট্রিক্স এর L)?


উপাত্ত

আমার ডেটাসেটটি সীমাবদ্ধ এবং সমস্যাটি দেখানো সহজ নয়। আমি কী বোঝাতে চাই এবং কী জিজ্ঞাসা করতে চাই তা বোঝাতে এখানে খেলনার সমস্যা তৈরি করেছি।

ছবিটি দেখুন,

প্রথমত, আমি কয়েকটি বাঁকা তরঙ্গগুলি এ, বি, সি লাল বক্ররেখাতে দেখি (চিত্রের প্রথম কলাম) তৈরি করি। A, B এবং C এর 1000 টি নমুনা রয়েছে, অন্য কথায়, 1x1000 ভেক্টরগুলিতে সংরক্ষণ করা হয়েছে।

দ্বিতীয়ত, আমি এ, বি, সি উত্স মিশ্রিত করে এলোমেলোভাবে তৈরি লিনিয়ার সংমিশ্রণগুলি ব্যবহার করে, যেমন, M=r1A+r2B+r3C, যা r1,r2,r3এলোমেলো মান। মিশ্র সংকেতM খুব উচ্চ মাত্রার স্থান, যেমন, MR1517×1000, 1517 এলোমেলোভাবে উচ্চ মাত্রিক স্থান বেছে নেওয়া হয়েছে। আমি কেবল প্রথম তিনটি সারি সংকেত এম সবুজ বক্ররেখা (চিত্রের দ্বিতীয় কলাম) এ দেখায়।

এরপরে, আমি মাত্রা হ্রাস ফলাফল পেতে পিসিএ, আইসিএ এবং ল্যাপ্লেসিয়ান ইগেনাম্যাপগুলি চালিত করি। আমি একটি সুষ্ঠু তুলনা করতে 3 টি পিসি, 3 আইসি এবং 3 এলইএস ব্যবহার করতে পছন্দ করেছি (নীল বক্ররেখা যথাক্রমে তৃতীয়, চতুর্থ এবং চিত্রের শেষ কলাম হিসাবে দেখানো হয়েছে)।

পিসিএ এবং আইসিএ (চিত্রের তৃতীয়, চতুর্থ কলাম) এর ফলাফল থেকে আমরা দেখতে পাচ্ছি যে আমরা ফলাফলগুলি কিছু মাত্রা হ্রাস হিসাবে ব্যাখ্যা করতে পারি, অর্থাৎ আইসিএ ফলাফলের জন্য, আমরা মিশ্র সংকেতটি পুনরুদ্ধার করতে পারি M=b1IC1+b2IC2+b3IC3 (আমরাও পেতে পারি কিনা তা নিশ্চিত নই M=a1PC1+a2PC2+a3PC3 পিসিএ ফলাফল সহ তবে ফলাফলটি আমার পক্ষে বেশ সঠিক বলে মনে হচ্ছে)।

তবে, দয়া করে এলই এর ফলাফলগুলি দেখুন, আমি সবেই ফলাফলগুলি ব্যাখ্যা করতে পারি (চিত্রের শেষ কলাম)। এটি হ্রাসকারী উপাদানগুলির সাথে কিছু 'ভুল' বলে মনে হচ্ছে। এছাড়াও, আমি উল্লেখ করতে চাই যে শেষ পর্যন্ত শেষ কলামের প্লটটি আইজেনভেেক্টরy সূত্রে Ly=λDy

আপনারা কি আরও ধারণা পেয়েছেন?

চিত্র 1 হিটিং কার্নেলের নিকটস্থ নিকটতম 12 প্রতিবেশী এবং সিগমা ব্যবহার করে 0.5: বাম থেকে ডানে কলাম: মূল সংকেত, মিশ্র সংকেত, পিসি, আইসি, এলইএস

চিত্র 2 হিটিং কার্নেলে 1000 নিকটতম প্রতিবেশী এবং সিগমা ব্যবহার করে 0.5: বাম থেকে ডানে কলাম: মূল সংকেত, মিশ্র সংকেত, পিসি, আইসি, এলইএস

Sourcecode: প্রয়োজনীয় প্যাকেজের সাথে মতলব কোড


2
এক্স এর হ্রাস উপাদানগুলি বলতে কী বোঝ? আপনি কি বলতে চান x এর একটি নিম্ন-মাত্রিক এম্বেডিং?
শ্রদ্ধেয়

এটি আকর্ষণীয় বলে মনে হচ্ছে। আসলে কী, আপনার ডেটা দেখতে কেমন তার আরও বিশদ বিবরণ দিতে পারবেন?
প্লাসিডিয়া

উত্তর:


4

আপনার প্রশ্নের উত্তরটি মূল ল্যাপলসিয়ান ইগেনম্যাপস পেপারের 6 পৃষ্ঠার নীচে ম্যাপিংয়ের মাধ্যমে দেওয়া হয়েছে :

xi(f1(i),,fm(i))

উদাহরণস্বরূপ, একটি পয়েন্ট এম্বেডিং x5 ইন, বলুন, শীর্ষ 2 "উপাদান" দ্বারা দেওয়া হয়েছে (f1(5),f2(5)) কোথায় f1 এবং f2 জেনারালাইজড ইগন্যাল্যু সমস্যা থেকে দু'টি ক্ষুদ্রতম শূন্য-ইগন্যালুগুলির সাথে সম্পর্কিত আইগ্রেভেক্টর Lf=λDf

মনে রাখবেন যে পিসিএ এর বিপরীতে নয়, কোনও নমুনা এমবেডিং-এর বাইরে পাওয়া সহজ নয়। অন্য কথায়, আপনি একটি বিন্দু এম্বেডিং অর্জন করতে পারেন যা কম্পিউটিং করার সময় ইতিমধ্যে বিবেচিত হয়েছিলL, তবে না (সহজেই) যদি এটি একটি নতুন পয়েন্ট হয়। আপনি যদি পরবর্তীকাজটি করতে আগ্রহী হন তবে এই কাগজটি সন্ধান করুন


আপনি কী আপনার ভেরিয়েবল হিসাবে বিবেচনা করছেন তা সম্পর্কে আমি কিছুটা বিভ্রান্ত। আমি যা বুঝতে পারি তা থেকে আপনার ম্যাট্রিক্সM1000-মাত্রিক স্থান থেকে 1517 টি নমুনা নিয়ে গঠিত। আপনি যখন এই ম্যাট্রিক্সে পিসিএ (বা আইসিএ) করেন, আপনি ভিন্নতার অন্তর্নিহিত পদ্ধতিগুলি বেশ ভালভাবে পুনরুদ্ধার করতে সক্ষম হবেন: উদাহরণস্বরূপ, আপনার পরিসংখ্যানের 3 কলামে, সারি 1,2,3 বেস, সি, এ, বি এর সাথে মিল রাখে যথাক্রমে। এইবার বুঝতে পারছি. যাইহোক, আপনার কোডে, আপনি যখন এলইএম সঞ্চালন করেন, আপনি ফাংশনটি কল করেনMT( mixedSignal'), যা উপরের সাথে সামঞ্জস্যপূর্ণ নয়।
শান্তনু

সুতরাং, প্রথম, ম্যাট্রিক্সে M, আপনি কী পরিবর্তনশীল এবং আপনার পর্যবেক্ষণগুলি কি? দ্বিতীয়ত, আপনার বিশ্লেষণ থেকে এটি প্রদর্শিত হয় যে আপনি কেবল এম্বেডিং খুঁজছেন নাMএলইএম ব্যবহার করে, তবে পিসিএ যেমন ইগেনভেেক্টরগুলির সমতুল্য, তাই না? আপনি এই এলইএমটি করতে পারবেন না, অন্তত সহজেই নয়। কেন বুঝতে এই কাগজ পড়ুন ।
শান্তনু

আপনি যা সন্ধান করছেন তা যদি এম্বেডিং হয় তবে তা ম্যাপিংয়ের মাধ্যমে সহজেই দেওয়া হবে xi(f1(i),,fm(i))। বিশদ জন্য আমার উত্তর সন্ধান করুন। আপনার কোডে 47 লাইন পরিবর্তন করুন এবং mixedSignalএর ট্রান্সপোজের পরিবর্তে ব্যবহার করুন; এর পরে ফলাফল mappedXআপনাকে আপনার 1517 পয়েন্টের 3-মাত্রিক এম্বেডিং দেবে।
শান্তনু

পিএস: উপরে, আমি বোঝাতে চাইছি "আপনি এলইএম ব্যবহার করে এটি করতে পারবেন না , কমপক্ষে সহজে নয়"।
শান্তনু

2

এখানে কোর্সের প্রোফেসার ট্রোসেটের ওয়েব পৃষ্ঠার লিঙ্কটি রয়েছে এবং তিনি একটি বই লিখছেন http://mypage.iu.edu/~mtrosset/Courses/675/notes.pdf যা প্রতি সপ্তাহে বা ততক্ষণে আপডেট হয়। এছাড়াও ল্যাপ্লাসিয়ান ইগেন মানচিত্রের জন্য আর ফাংশন দেওয়া হয়েছে। নিজের জন্য চেষ্টা করুন। আপনি এই বিবেচনা করতে পারে কাগজ Belkin দ্বারা

ধন্যবাদ প্রফেস ট্রসসেটের অভীক শিক্ষার্থী


1

পিসিএ-ল্যাপলাসিয়ান ইগেনম্যাপের বিপরীতে সবচেয়ে ছোট ইগেনালুগুলির সাথে সম্পর্কিত সাধারণীকরণ আইগেন ভেক্টর ব্যবহার করে। এটি ইগেন ভেক্টরকে ক্ষুদ্রতম ইগেন মান (শূন্য হতে পারে) দিয়ে এড়িয়ে যায় এবং পরবর্তী কয়েকটি ক্ষুদ্র ইগেন মানগুলির সাথে সম্পর্কিত ইগেন ভেক্টর ব্যবহার করে। পিসিএ হ'ল কর্নেল / গ্রাম ম্যাট্রিক্স ব্যবহার করে এম্বেডিং সংরক্ষণের সর্বাধিক বৈকল্পিক। সংযুক্তি গ্রাফ ল্যালাপাসিয়ান (ট্রসেটের কাগজপত্রগুলি দেখুন) সম্পর্কিত ক্ষেত্রে ল্যাপ্লেসিয়ান ইগেনম্যাপসকে ন্যূনতম সমস্যার হিসাবে আরও উত্থাপিত হয়।


আগ্রহী প্রত্যেকে আমার প্রশ্নটি আবার দেখুন। আমি কিছু উদাহরণ রেখেছি। অনেক ধন্যবাদ.
সামো জেরম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.