আসুন Nyström আনুমানিকতা এমনভাবে উপস্থাপন করুন যাতে আপনার প্রশ্নের উত্তরগুলি আরও পরিষ্কার করা উচিত।
Nyström এর মূল অনুমানটি হ'ল কার্নেল ফাংশনটি র্যাঙ্কের হয় । (সত্যিই আমরা ধরে নিই যে এটি প্রায় র্যাঙ্ক এর প্রায় , তবে সরলতার জন্য এখনকার জন্য ঠিক এটি র্যাঙ্ক ভান করা উচিত )) এর অর্থ হ'ল যে কোনও কার্নেল ম্যাট্রিক্সের বেশিরভাগ র্যাঙ্ক থাকবে এবং বিশেষত
র্যাঙ্ক । সুতরাং ননজারো ইগেনভ্যালু রয়েছে এবং আমরা এর ইউজেনডেকপজিশন লাম্বদা হিসাবে
লিখতে পারিmmmm
K=⎡⎣⎢⎢k(x1,x1)⋮k(xn,x1)…⋱…k(x1,xn)⋮k(xn,xn)⎤⎦⎥⎥,
mmKK=UΛUT
igen , একটি ডায়াগোনাল ম্যাট্রিক্সে সজ্জিত -আকৃতির, shape আকারের ইউজেনভেেক্টর সহ ।
Un×mΛm×m
সুতরাং, আসুন উপাদানগুলি চয়ন করুন, সাধারণত এলোমেলোভাবে তবে সম্ভবত অন্যান্য স্কিম অনুসারে - এই সরলীকৃত সংস্করণে যে সমস্ত বিষয় রয়েছে তা full সম্পূর্ণ পদমর্যাদার। একবার করার পরে, কেবলমাত্র পয়েন্টগুলি পুনর্বিবেচনা করুন যাতে আমরা ব্লকগুলিতে কার্নেল ম্যাট্রিক্সের সাথে শেষ করি:
যেখানে আমরা (যা ) এবং ( ) এর প্রতিটি প্রবেশ মূল্যায়ন করি , কিন্তু কোনও মূল্যায়ন করতে চাই না ।mK11
K=[K11K21KT21K22],
K11m×mK21(n−m)×mK22
এখন, আমরা এই ব্লক স্ট্রাকচার অনুসারে ইজেনডিকোপজিশনটিও বিভক্ত করতে পারি:
যেখানে হয় এবং হয় । তবে মনে রাখবেন যে এখন আমাদের । সুতরাং আমরা জানতে পারেন এবং পরিচিত ম্যাট্রিক্স eigendecomposing দ্বারা ।
K=UΛUT=[U1U2]Λ[U1U2]T=[U1ΛUT1U2ΛUT1U1ΛUT2U2ΛUT2],
U1m×mU2(n−m)×mK11=U1ΛUT1U1ΛK11
আমরা এও জানি যে । এখানে, আমরা ছাড়া এই সমীকরণ সবকিছু জানেন , তাই আমরা কি eigenvalues বোঝা যে জন্য সমাধান করতে পারে: ডান-সংখ্যাবৃদ্ধি দ্বারা উভয় পক্ষের পেতে
:
মূল্যায়নের জন্য আমাদের যা যা দরকার তা এখন রয়েছেK21=U2ΛUT1U2(ΛUT1)−1=U1Λ−1
U2=K21U1Λ−1.
K22K22=U2ΛUT2=(K21U1Λ−1)Λ(K21U1Λ−1)T=K21U1(Λ−1Λ)Λ−1UT1KT21=K21U1Λ−1UT1KT21=K21K−111KT21=(K21K−1211)(K21K−1211)T.(*)(**)
(*) এ, আমরা সম্ভবত Nyström এমবেডিংয়ের একটি সংস্করণ পেয়েছি যা আপনি সম্ভবত সংজ্ঞা হিসাবে দেখতে পেয়েছেন। এটা আমাদের কার্যকর কার্নেল মান বলে যে আমরা ব্লক জন্য আরোপিত হিসাবের করছি ।K22
(**) এ, আমরা দেখতে পেলাম ম্যাট্রিক্স বৈশিষ্ট্যটি , যা আকার , এই নিষ্ক্রিয় কার্নেল মানগুলির সাথে মিলে যায়। যদি আমরা পয়েন্টগুলির জন্য ব্যবহার করি তবে আমাদের কাছে ডাইমেনশনাল বৈশিষ্ট্যগুলি রয়েছে
আমরা কেবল তাড়াতাড়ি যাচাই করতে পারি যে সঠিক কার্নেল ম্যাট্রিক্সের সাথে মিলে যায়:
K21K−1211(n−m)×mK1211mm
Φ=⎡⎣⎢K1211K21K−1211⎤⎦⎥.
ΦΦΦT=⎡⎣⎢K1211K21K−1211⎤⎦⎥⎡⎣⎢K1211K21K−1211⎤⎦⎥T=⎡⎣⎢K1211K1211K21K−1211K1211K1211K−1211KT21K21K−1211K−1211KT21⎤⎦⎥=[K11K21KT21K21K−111KT21]=K.
সুতরাং, আমাদের কেবলমাত্র আমাদের নিয়মিত শেখার মডেলটিকে ডাইমেনশনাল বৈশিষ্ট্যগুলি সহ প্রশিক্ষণ করতে হবে । এই হতে হবে ঠিক (অনুমানের অধীনে আমরা তৈরি করেছি) একই সঙ্গে লার্নিং সমস্যার kernelized সংস্করণ হিসেবে ।mΦK
এখন, পৃথক ডেটা পয়েন্ট , র
বৈশিষ্ট্যগুলিপার্টিশন ২-এর
একটি বিন্দু জন্য , ভেক্টর কেবল of এর প্রাসঙ্গিক সারি , যাতে স্ট্যাকিং এগুলি আমাদের - তাই বিভাজন 2 এর পয়েন্টগুলির সাথে একমত হয় এটি বিভাজন 1 এও কাজ করে: সেখানে, ভেক্টরটি সারি , সুতরাং তাদের , আবার সাথে একমত হয়েxΦ
ϕ(x)=[k(x,x1)…k(x,xm)]K−1211.
x[k(x,x1)…k(x,xm)]K21K21K−1211ϕ(x)K11K11K−1211=K1211Φ। তাই ... এটা এখনও একটি অদেখা-অ্যাট-প্রশিক্ষণ-টাইম পরীক্ষা পয়েন্টের জন্য সত্য । আপনি কেবল একই কাজটি করেছেন:
যেহেতু আমরা ধরে নিয়েছি যে কার্নেলটি র্যাঙ্ক , ম্যাট্রিক্স পদে হয় , এবং পুনর্গঠন হিসাবে ঠিক একই যুক্তি দ্বারা সঠিক এখনও ।
xnewΦtest=Ktest,1K−1211.
m[KtrainKtest,trainKtrain,testKtest]mKtestK22
সর্বোপরি, আমরা অধিকৃত যে কার্নেল ম্যাট্রিক্স ছিল
ঠিক র্যাঙ্ক । এটি সাধারণত ক্ষেত্রে হয় না; একটি গসিয়ান কার্নেল জন্য, উদাহরণস্বরূপ, হয়
সবসময় র্যাঙ্ক কিন্তু আধুনিক eigenvalues সাধারণত প্রশংসনীয় দ্রুত ড্রপ বন্ধ তাই এটি হতে যাচ্ছে
পাসে পদে একটি ম্যাট্রিক্স , এবং আমাদের পুনর্গঠন বা সত্য মানগুলির
কাছাকাছি হতে চলেছে তবে ঠিক একই নয়। তারা ভাল পুনর্গঠন কাছাকাছি এর eigenspace হবেন যে পায়
KmKnmK21Ktest,1K11Kসামগ্রিকভাবে, তাই সঠিক পয়েন্টগুলি নির্বাচন করা অনুশীলনে গুরুত্বপূর্ণ।
m
আরও মনে রাখবেন যে এর কোনও শূন্য ইগ্যালভ্যালু থাকলে আপনি বিপরীতগুলি সিউডোইনভার্সগুলি প্রতিস্থাপন করতে পারেন এবং সমস্ত কিছু এখনও কাজ করে; আপনি শুধু প্রতিস্থাপন পুনর্গঠন সঙ্গে ।K11K21K21K†11K11
আপনি চাইলে egendecomposition এর পরিবর্তে SVD ব্যবহার করতে পারেন; যেহেতু পিএসডি হয়, তারা একই জিনিস, তবে এসভিডি কার্নেল ম্যাট্রিক্স এবং এর মধ্যে সংখ্যাসূচক ত্রুটির তুলনায় আরও কিছুটা শক্তিশালী হতে পারে, তাই বিজ্ঞান-শিখাই তা করে। সাইকিট-শিখার আসল বাস্তবায়ন এটি করে, যদিও এটি সিউডোয়েন্টের পরিবর্তে বিপরীতে mb ল্যাম্বদা_আই ব্যবহার করে।Kmax(λi,10−12)