প্রশ্ন ট্যাগ «dimensionality-reduction»

সম্ভব তথ্য হিসাবে যতটা তথ্য সংরক্ষণ করার জন্য ডেটা দ্বারা বিস্তৃত পরিমাণে ভেরিয়েবল বা মাত্রাগুলি একটি অল্প সংখ্যক মাত্রায় হ্রাস করার কৌশলগুলি বোঝায়। বিশিষ্ট পদ্ধতিগুলির মধ্যে রয়েছে পিসিএ, এমডিএস, আইসোম্যাপ ইত্যাদি techniques কৌশলগুলির মূল দুটি সাবক্লাস: বৈশিষ্ট্য নিষ্কাশন এবং বৈশিষ্ট্য নির্বাচন।

5
শীর্ষস্থানীয় প্রধান উপাদানগুলি নির্ভরশীল পরিবর্তনশীল (বা আরও ভাল পূর্বাভাসের দিকেও যেতে পারে) এর উপর ভবিষ্যদ্বাণীপূর্ণ শক্তি ধরে রাখতে পারে?
মনে করুন আমি একটি রিগ্রেশন চালাচ্ছি । কেন এক্স এর শীর্ষ কে নীতি উপাদান নির্বাচন করে, মডেলটি ওয়াইয়ের উপর তার ভবিষ্যদ্বাণীপূর্ণ শক্তি ধরে রাখে ?ওয়াই। এক্সY∼XY \sim Xএক্স ওয়াইটkkএক্সXXওয়াইYY আমি বুঝতে পারি যে মাত্রিকতা-হ্রাস / বৈশিষ্ট্য-নির্বাচনের দৃষ্টিকোণ থেকে, যদি v_1, v_2, ... v_k শীর্ষ কে ইগেনভ্যালুগুলির সাথে এক্সেরবনাম1, ভি2, । …

2
"ননলাইনার" কীভাবে "ননলাইনারের মাত্রা হ্রাস" হিসাবে বোঝা যায়?
আমি লিনিয়ার মাত্রিকতা হ্রাস পদ্ধতির (যেমন, পিসিএ) এবং ননলাইনারের (যেমন, আইসোম্যাপ) মধ্যে পার্থক্যগুলি বোঝার চেষ্টা করছি। এই প্রসঙ্গে (অ) রৈখিকতা কী বোঝায় তা আমি বেশ বুঝতে পারি না। আমি উইকিপিডিয়া থেকে পড়েছি যে তুলনা করে, যদি পিসিএ (একটি রৈখিক মাত্রিকতা হ্রাস অ্যালগরিদম) একই ডেটাসেটটিকে দুটি মাত্রায় হ্রাস করতে ব্যবহার করা …

3
ভিজ্যুয়ালাইজেশনের জন্য মাত্রিকতা হ্রাস টি-এসএনই দ্বারা সমাধান করা "বন্ধ" সমস্যা হিসাবে বিবেচনা করা উচিত?
মাত্রিকতা হ্রাসের জন্য স্নে অ্যালগরিদম সম্পর্কে আমি অনেক পড়ছি । আমি এমএনআইএসটির মতো "ক্লাসিক" ডেটাসেটের পারফরম্যান্সে খুব মুগ্ধ হয়েছি যেখানে এটি সংখ্যার স্পষ্ট বিভাজন অর্জন করে ( মূল নিবন্ধটি দেখুন ):টিটিt আমি এটি প্রশিক্ষণ নিচ্ছিলাম এমন একটি নিউরাল নেটওয়ার্ক দ্বারা শিখে নেওয়া বৈশিষ্ট্যগুলি ভিজ্যুয়ালাইজ করার জন্যও এটি ব্যবহার করেছি এবং …

2
"হ্রাস-র‌্যাঙ্কের রিগ্রেশন" কী?
আমি স্ট্যাটিস্টিকাল লার্নিং এর উপাদানগুলি পড়ছি এবং আমি বুঝতে পারি না যে বিভাগ 3.7 "একাধিক ফলাফল সংকোচন এবং নির্বাচন" কী is এটি আরআরআর (হ্রাস-র‌্যাঙ্কের রিগ্রেশন) সম্পর্কে আলোচনা করে, এবং আমি কেবল বুঝতে পারি যে ভিত্তিটি একটি সাধারণীকৃত মাল্টিভারিয়েট লিনিয়ার মডেল সম্পর্কে যেখানে সহগগুলি অজানা (এবং অনুমান করা যায়) তবে তার …

1
যদি মাত্রাগুলির সংখ্যা হয় তবে
পিসিএ সালে যখন এর মাত্রা সংখ্যা চেয়ে বড় (অথবা এমনকি সমান করার জন্য) নমুনা সংখ্যা কেন যেগুলি আপনি থাকতে হবে নন-জিরো eigenvectors? অন্য কথায়, ডের ডাইমেনশনের মধ্যে কোভেরিয়েন্স ম্যাট্রিক্সের র‌্যাঙ্কটি ।dddNNNN−1N−1N-1d≥Nd≥Nd\ge NN−1N−1N-1 উদাহরণ: আপনার নমুনাগুলি ভেক্টরাইজড ইমেজ, যা ডাইমেনশন , , তবে আপনার কেবল চিত্র রয়েছে।d=640×480=307200d=640×480=307200d = 640\times480 = 307\,200N=10N=10N=10

1
টি-এসএনই বনাম এমডিএস
সম্পর্কে কিছু প্রশ্ন পড়া হয়েছে টি-Sne ( টি-বন্টিত স্টচাস্টিক নেইবার এমবেডিং ) ইদানীং, এবং এছাড়াও সম্পর্কে কিছু প্রশ্ন পরিদর্শন MDS ( বহুমাত্রিক স্কেলিং )। এগুলি প্রায়শই আনুষাঙ্গিকভাবে ব্যবহৃত হয়, সুতরাং দেখে মনে হচ্ছে একটি ভাল ধারণা এই প্রশ্নটি তৈরি করে দেখুন যে এখানে উভয় পৃথকভাবে (বা পিসিএর তুলনায় ) অনেকগুলি …

3
পিসিএ যখন নমুনার সংখ্যার চেয়ে বেশি হয় sion
আমি এমন একটি দৃশ্যের মুখোমুখি হয়েছি যেখানে আমার 10 জনের জন্য 10 সংকেত / ব্যক্তি রয়েছে (সুতরাং 100 নমুনা) যাতে 14000 ডেটা পয়েন্ট (মাত্রা) থাকে যা আমার একটি শ্রেণিবদ্ধের কাছে যেতে হবে। আমি এই ডেটার মাত্রিকতা হ্রাস করতে চাই এবং পিসিএ মনে হয় এটি করার উপায়। যাইহোক, আমি কেবলমাত্র পিসিএর …

4
মিশ্রিত ডেটা ইউক্লিডিয়ান ভিত্তিক ক্লাস্টারিং অ্যালগরিদমের জন্য কেন সমস্যা?
বেশিরভাগ ধ্রুপদী ক্লাস্টারিং এবং মাত্রিকতা হ্রাস অ্যালগরিদম (হায়ারারিকিকাল ক্লাস্টারিং, মূল উপাদান বিশ্লেষণ, কে-মানে, স্ব-সংগঠিত মানচিত্র ...) বিশেষত সংখ্যাসূচক তথ্যগুলির জন্য ডিজাইন করা হয়েছে এবং তাদের ইনপুট ডেটা ইউক্যালিডিয়ান স্পেসে পয়েন্ট হিসাবে দেখা হয়। এটি অবশ্যই একটি সমস্যা, যেমনটি অনেক বাস্তব-জগতের প্রশ্নগুলিতে ডেটা যুক্ত থাকে যা মিশ্রিত হয়: উদাহরণস্বরূপ যদি আমরা …

4
কার্যকরী প্রধান উপাদান বিশ্লেষণ (এফপিসিএ): এটি সমস্ত কি?
কার্যকরী মূল উপাদান বিশ্লেষণ (এফপিসিএ) এমন একটি জিনিস যা আমি হোঁচট খেয়েছি এবং কখনই বুঝতে পারি নি। এটা সব সম্পর্কে কি? শ্যাং, ২০১১ দ্বারা "কার্যকরী প্রধান উপাদান বিশ্লেষণের সমীক্ষা" দেখুন এবং আমি উদ্ধৃত করছি: পিসিএ "মাত্রিকতার অভিশাপ" (বেলম্যান 1961) এর কারণে কার্যকরী তথ্য বিশ্লেষণে গুরুতর অসুবিধায় পড়েছে। "মাত্রিকতার অভিশাপ" উচ্চ …

1
এলডিএ, শ্রেণিবদ্ধকরণ কৌশল কীভাবে পিসিএর মতো মাত্রিকতা হ্রাস কৌশল হিসাবে কাজ করে
এই নিবন্ধে , লেখক রৈখিক বৈষম্যমূলক বিশ্লেষণকে (এলডিএ) প্রধান উপাদান বিশ্লেষণের (পিসিএ) সাথে সংযুক্ত করেছেন। আমার সীমিত জ্ঞানের সাথে, আমি কীভাবে এলডিএ পিসিএর সাথে কিছুটা মিল হতে পারে তা অনুসরণ করতে পারছি না। আমি সবসময়ই ভেবে এসেছি যে এলডিএ হ'ল লজিস্টিক রিগ্রেশনের অনুরূপ শ্রেণিবদ্ধকরণ অ্যালগরিদমের একটি রূপ। আমি কীভাবে এলডিএ …

5
স্ট্রিমিং ডেটার জন্য কি টি-এসএনইর কোনও সংস্করণ রয়েছে?
টি-এসএনই এবং বার্নস-হাট আনুমানিক সম্পর্কে আমার বোঝার জন্য সমস্ত ডেটা পয়েন্টের প্রয়োজন হয় যাতে সমস্ত ফোর্স ইন্টারেক্টেশন একই সাথে গণনা করা যায় এবং প্রতিটি পয়েন্ট 2 ডি (বা নিম্ন মাত্রিক) মানচিত্রে সামঞ্জস্য করা যায়। টি-স্নের এমন কোনও সংস্করণ রয়েছে যা দক্ষতার সাথে স্ট্রিমিং ডেটা মোকাবেলা করতে পারে? সুতরাং যদি আমার …

1
টি-এসএনই প্রয়োগের আগে ডেটা কেন্দ্রীকরণ + স্কেল করা উচিত?
আমার ডেটাগুলির কয়েকটি বৈশিষ্ট্যের বড় মান রয়েছে, অন্য বৈশিষ্ট্যগুলির মধ্যে খুব ছোট মান রয়েছে। বৃহত্তর মানগুলির প্রতি পক্ষপাতিত্ব রোধ করতে টি-এসএনই প্রয়োগ করার আগে কি + স্কেল ডেটা কেন্দ্র করা প্রয়োজন? আমি পাইথনের sklearn.manifold.TSNE বাস্তবায়ন ডিফল্ট ইউক্লিডিয়ান দূরত্বের মেট্রিকের সাথে ব্যবহার করি।

4
"মাত্রিকতার অভিশাপ" কি সত্যই ডেটাতে উপস্থিত রয়েছে?
আমি বুঝতে পারি "মাত্রিকতার অভিশাপ" কী, এবং আমি কিছু উচ্চ মাত্রিক অপ্টিমাইজেশান সমস্যাগুলি করেছি এবং তাত্পর্যপূর্ণ সম্ভাবনার চ্যালেঞ্জটি জানি। তবে, আমি সন্দেহ করি যে বেশিরভাগ বাস্তব বিশ্বের ডেটাতে "মাত্রিকতার অভিশাপ" উপস্থিত রয়েছে কিনা (ভালভাবে একটি চিত্রের জন্য ছবি বা ভিডিওগুলি একপাশের জন্য রেখে দেওয়া যাক, আমি গ্রাহক ডেমোগ্রাফিক এবং ক্রয় …

4
এসভিডি / পিসিএর জন্য "নরমালাইজিং" ভেরিয়েবল
ধরুন আমাদের কাছে NNN পরিমাপযোগ্য ভেরিয়েবল রয়েছে, (a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N) , আমরা পরিমাপের একটি M>NM>NM > N , এবং তারপরে ফলাফলটির জন্য একক মান পচনের জন্য উচ্চতর বৈকল্পের অক্ষগুলি খুঁজে পেতে ইচ্ছুক এন- ডাইমেনশনাল স্পেসে MMM পয়েন্টগুলি । ( নোট: অনুমান মাধ্যমে একটি আমি ইতিমধ্যে বিয়োগ করা হয়েছে, তাই …

2
আমরা কখন ক্লাস্টারিংয়ের সাথে মাত্রিকতা হ্রাস একত্রিত করব?
আমি নথি-স্তরের ক্লাস্টারিংয়ের চেষ্টা করছি। আমি টার্ম-ডকুমেন্ট ফ্রিকোয়েন্সি ম্যাট্রিক্সটি তৈরি করেছি এবং আমি কে-মাধ্যম ব্যবহার করে এই উচ্চ মাত্রিক ভেক্টরগুলিকে ক্লাস্টার করার চেষ্টা করছি। সরাসরি ক্লাস্টারিংয়ের পরিবর্তে, আমি যা করেছি তা হ'ল প্রথমে ইউ, এস, ভিটি ম্যাট্রিকেসগুলি অর্জনের জন্য এলএসএ'র (প্রচ্ছন্ন সিমেটিক বিশ্লেষণ) একক ভেক্টর পচন প্রয়োগ করতে হবে এবং …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.