এলএলই (স্থানীয় রৈখিক এম্বেডিং) অ্যালগরিদমের পদক্ষেপগুলি ব্যাখ্যা করুন?


13

আমি বুঝতে পারি এলএলইর জন্য অ্যালগরিদমের পিছনে মূল নীতিটি তিনটি পদক্ষেপ নিয়ে গঠিত।

  1. কিছু মেট্রিক যেমন কে-এনএন দ্বারা প্রতিটি ডেটা পয়েন্টের আশপাশ সন্ধান করা।
  2. প্রতিবেশীর জন্য ওজন সন্ধান করুন যা প্রতিবেশীর ডেটা পয়েন্টে কী প্রভাব ফেলে তা বোঝায়।
  3. গণিত ওজনের উপর ভিত্তি করে ডেটাটির নিম্ন মাত্রিক এম্বেডিং তৈরি করুন।

তবে 2 এবং 3 পদক্ষেপের গাণিতিক ব্যাখ্যাগুলি আমার পাঠ্য সমস্ত পাঠ্য বই এবং অনলাইন সংস্থানগুলিতে বিভ্রান্ত করছে। সূত্রগুলি কেন ব্যবহৃত হচ্ছে তা আমি যুক্তিযুক্ত করতে পারছি না।

এই পদক্ষেপগুলি বাস্তবে কীভাবে সম্পাদিত হয়? গাণিতিক সূত্রগুলি ব্যাখ্যার কোন স্বজ্ঞাত উপায় আছে?

তথ্যসূত্র: http://www.cs.nyu.edu/~roweis/lle/publications.html

উত্তর:


10

স্থানীয় লিনিয়ার এম্বেডিং (এলএলই) দূরবর্তী বস্তুর মধ্যে দূরত্ব অনুমান করার প্রয়োজনীয়তা দূর করে এবং স্থানীয় লিনিয়ার ফিটগুলির দ্বারা বৈশ্বিক অ-রৈখিক কাঠামো পুনরুদ্ধার করে। এলএলই সুবিধাজনক কারণ এটি শেখার হার বা রূপান্তর মানদণ্ডের মতো কোনও পরামিতি জড়িত না। LLE এছাড়াও স্বকীয় মাত্রা সঙ্গে ভাল আইশ । এলএলই এর উদ্দেশ্যগত কার্য হ'ল এবং বস্তুর জন্য ওজন ম্যাট্রিক্স উপাদানগুলি যদি শূন্যতে সেট করা থাকে তবেY

ζ(Y)=(YWY)2=Y(IW)(IW)Y
Wwijijj খুব কাছের প্রতিবেশী নই , অন্যথায়, কমপক্ষে স্কোয়ারের মাধ্যমে কে-নিকটস্থ বস্তুর কাছের ওজন নির্ধারণ যেখানে নির্ভরশীল ভেরিয়েবল a একটি ভেক্টর, object হ'ল এর নিকটবর্তী সমস্ত প্রতিবেশী এবং গ্রাম ম্যাট্রিক্স , এবং a একটি ওজনের ভেক্টর যা সম-থেকে-unityক্যের সীমাবদ্ধতাগুলি অনুসরণ করে। যাক a এক প্রতিসম ধনাত্মক ইতিবাচক semidefinite গুণুকii
U=Gβ
UK×1GK×KiβK×1DK×K ডাইমেনশনাল অবজেক্ট এর কে-নিকটতম প্রতিবেশীদের সমস্ত জোড়ার জন্য দূরত্বের ম্যাট্রিক্স । এটি দেখানো যেতে পারে যে elements উপাদানগুলির দ্বিগুণ-কেন্দ্রিক দূরত্বের ম্যাট্রিক্স to এর সমান রিগ্রেশন কোফিসিয়েন্টস নির্ধারিত সংখ্যাসূচকভাবে ব্যবহার করছেন pxiGτ
τlm=12(dlm21Kldlm21Kmdlm2+lmdlm2).
K
βK×1=(ττ)K×K1τUK×1,
এবং তারা unityক্যের যোগফল নিশ্চিত করার জন্য চেক করা হয়। এর মান সারি মধ্যে এমবেড করা হয় এর বস্তুর কে-নিকটতম প্রতিবেশীদের সংশ্লিষ্ট বিভিন্ন কলাম অবস্থানের সময়ে , সেইসাথে TRANSPOSE উপাদান। এটি ডেটাসেটের প্রতিটি ম অবজেক্টের জন্য পুনরাবৃত্তি হয় । এটি সতর্কতার সাথে সতর্ক করে দিয়েছে যে নিকটতম প্রতিবেশী এর সংখ্যা খুব কম হলে sp sp বিরল হতে পারে যার ফলে ইজিজেনালাইসিস কঠিন হয়ে পড়ে। দেখা গেছে যে নিকটতম প্রতিবেশীদের ফলাফল inβiWiiKWK=9Wম্যাট্রিক্স যা ইগিজেনালাইসিসের সময় প্যাথলজগুলি ধারণ করে না। Function ক্ষুদ্রতম অ-শূন্য ইগ্যালুয়ালগুলি খুঁজে বের করে উদ্দেশ্য কার্যটি হ্রাস করা হয় কমে ফর্ম দ্বারা প্রতিনিধিত্ব করা হয় যেখানে মাত্রা রয়েছে দুই সর্বনিম্ন eigenvalues উপর ভিত্তি করে ।
(IW)(IW)E=ΛDE.
XY=EEn×2Λ


"কে = 9 নিকটতম প্রতিবেশী" এটি কি এর মাত্রিকতার উপর নির্ভর করে না ? উদাহরণস্বরূপ, যদি এর 9 টিরও কম মাত্রা থাকে তবে ওজন ম্যাট্রিক্স স্বতন্ত্রভাবে নির্ধারিত হয় না। এটি কি এলএলইতে সমস্যা সৃষ্টি করে? YYW
স্কট

হ্যাঁ, তবে যদি 8 টি মাত্রা থাকে তবে এলোমেলো উপাত্তের জন্য আক্ষরিক অর্থে প্রতিটি বিন্দু 9 টির একটি রৈখিক সংমিশ্রণ হিসাবে নিখুঁতভাবে লেখা যেতে পারে, অসীম সংখ্যক উপায়ে।
স্কট

কোনও প্রযুক্তি বাস্তবায়নের সময় সবসময় "কী হয়" পরিস্থিতিতে থাকে এবং সে কারণেই প্যারামিটারের সীমাবদ্ধতাগুলি ব্যবহৃত হয়।
এনএক্সজি লজিক 16
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.