পরবর্তী সময়ে একটি স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) সম্পাদন করার জন্য আমার তরঙ্গকার্যগুলির প্রসেসোসিংয়ের সঠিক পদক্ষেপগুলি কী কী ? আমি কীভাবে বুঝতে পারি, যদিও এর আরও ব্যাখ্যা আঘাত না করে তবে আমি কেন এটিতে আগ্রহী।
পরবর্তী সময়ে একটি স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) সম্পাদন করার জন্য আমার তরঙ্গকার্যগুলির প্রসেসোসিংয়ের সঠিক পদক্ষেপগুলি কী কী ? আমি কীভাবে বুঝতে পারি, যদিও এর আরও ব্যাখ্যা আঘাত না করে তবে আমি কেন এটিতে আগ্রহী।
উত্তর:
স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) এর পরিসংখ্যানগতভাবে স্বতন্ত্র এবং সবচেয়ে গুরুত্বপূর্ণ, অ-গাউশিয়ান † উপাদানগুলির একটি রৈখিক মিশ্রণ পৃথক করতে ব্যবহৃত হয় । একটি গোলমুক্ত আইসিএর জন্য আদর্শ মডেল
যেখানে পর্যবেক্ষণ বা তথ্য ভেক্টর হয়, গুলি করা হয় একটি উৎস সংকেত / মূল উপাদান (অ-গসিয়ান) এবং একটি একটি রূপান্তর ভেক্টর যে সংজ্ঞায়িত উপাদান সংকেত রৈখিক মেশানো। সাধারণত, এ এবং স অজানা।
আইসিএতে দুটি প্রধান প্রাক-প্রক্রিয়াজাতকরণ কৌশল রয়েছে, যাকে কেন্দ্র করে এবং সাদা করা / গোলাকার করা হয়। প্রাক প্রক্রিয়াজাতকরণের প্রাথমিক কারণগুলি হ'ল:
জি লি এবং জে জাংয়ের পরিচিতি থেকে, "স্পেরিং এবং এর বৈশিষ্ট্যগুলি", দ্য ইন্ডিয়ান জার্নাল অফ স্ট্যাটিস্টিকস, খণ্ড। 60, সিরিজ এ, প্রথম খণ্ড, পৃষ্ঠা 119-133, 1998:
আউটলিয়ার্স, ক্লাস্টার বা অন্যান্য ধরণের গ্রুপ এবং বক্ররেখার কাছাকাছি ঘনত্ব বা তলদেশে নন probably সম্ভবত গুরুত্বপূর্ণ বৈশিষ্ট্য যা ডেটা বিশ্লেষকদের আগ্রহী। এগুলি সাধারণভাবে নমুনার গড় এবং কোভেরিয়েন্স ম্যাট্রিক্স সম্পর্কে জ্ঞান অর্জনের মাধ্যমে পাওয়া যায় না। এই পরিস্থিতিতে, ওকে আলাদা করা বাঞ্চনীয় the গড় এবং কোভেরিয়েন্সের ম্যাট্রিকগুলিতে থাকা তথ্যগুলি আমাদের সেই ডেটা-সেটগুলির দিকগুলি পরীক্ষা করতে বাধ্য করে যারা সেগুলি বোঝে at কেন্দ্রীভূতকরণ এবং স্ফিয়ারিং একটি সহজ এবং স্বজ্ঞাত পদ্ধতি যা মধ্য-কোভেরিয়েন্স সম্পর্কিত তথ্যগুলি সরিয়ে দেয় এবং লিনিয়ার পারস্পরিক সম্পর্ক এবং উপবৃত্তাকার আকারের বাইরে কাঠামো হাইলাইট করতে সহায়তা করে এবং তাই প্রায়শই ডেটা সেটগুলির প্রদর্শন বা বিশ্লেষণ অন্বেষণের আগে সঞ্চালিত হয়
1. কেন্দ্রিং:
কেঁদ্রীকরণ একটি খুব সহজ অপারেশন এবং সহজভাবে গড় বিয়োগ বোঝায় । অনুশীলনে, আপনি নমুনা গড়টি ব্যবহার করেন এবং একটি নতুন ভেক্টর তৈরি করেন x c = x - ¯ x , যেখানে ¯ x ডেটার গড়। জ্যামিতিকভাবে, গড়কে বিয়োগ করা স্থানাঙ্কের কেন্দ্রটিকে অনুবাদ করার সমতুল্য । গড়টি সর্বদা ফলাফলের সাথে আবার যুক্ত করা যেতে পারে (এটি সম্ভব কারণ ম্যাট্রিক্সের গুণটি বিভাজন হয়)।
2. সাদা করা:
শুভ্রকরণ একটি রূপান্তর এটি একটি পরিচয় সহভেদাংক ম্যাট্রিক্স, অর্থাত, হয়েছে ধর্মান্তরিত তথ্য যেমন যে হয় । সাধারণত, আপনি নমুনা কোভারিয়েন্স ম্যাট্রিক্সের সাথে কাজ করেন,
যেখানে যথাযথ নরমালাইজেশন ফ্যাক্টরের ( x এর মাত্রার উপর নির্ভর করে ) কেবল আমার অলস স্থানধারক । একটি নতুন সাদা রঙের ভেক্টর হিসাবে তৈরি করা হয়
যার একটি সহভেদাংক থাকবে । জ্যামিতিকভাবে, সাদা করা একটি স্কেলিং রূপান্তর। এখানে গাণিতিকের একটি ছোট উদাহরণ রয়েছে:
s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[Transpose@x.x/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]
প্রথম চক্রান্ত দুই অবিশেষে বিতরণ র্যান্ডম ভেক্টর, বা উপাদান যুগ্ম ঘনত্ব । দ্বিতীয়টি রূপান্তর ভেক্টর এ দ্বারা গুণমানের প্রভাব প্রদর্শন করে । বর্গক্ষেত্রটি স্কিউড হয় এবং একটি রম্বসকে আকার দেওয়া হয়। ঝকঝকে ম্যাট্রিক্সের সাথে গুণ করে, যৌথ ঘনত্বটি আবার একটি বর্গক্ষেত্রের দিকে ফিরে আসে যা মূল থেকে সামান্য ঘোরানো হয়।
যদি, রূপান্তরের পরে, শূন্যের কাছাকাছি এগেনভ্যালুগুলি থাকে, তবে এগুলি নিরাপদে বাদ দেওয়া যেতে পারে কারণ এটি কেবলমাত্র শব্দ মাত্র এবং "ওভারলিটারিং" এর কারণে অনুমানকে ব্যাহত করবে।
3. অন্যান্য প্রাক প্রক্রিয়াজাতকরণ
কিছু নির্দিষ্ট অ্যাপ্লিকেশন জড়িত অন্যান্য প্রাক প্রক্রিয়াজাতকরণ পদক্ষেপ থাকতে পারে যা একটি উত্তর আবরণ অসম্ভব। উদাহরণস্বরূপ, আমি কয়েকটি নিবন্ধ দেখেছি যা সময়-সিরিজের লগ ব্যবহার করে এবং আরও কয়েকটি যা সময়-সিরিজ ফিল্টার করে। যদিও এটি তাদের বিশেষ প্রয়োগ / শর্তগুলির জন্য উপযুক্ত হতে পারে তবে ফলাফলগুলি সমস্ত ক্ষেত্রেই বহন করে না।
† আমি বিশ্বাস করি যে আইসিএ ব্যবহার করা সম্ভব হয় যদি বেশিরভাগ উপাদানগুলির মধ্যে একটি গাউসিয়ান হয়, যদিও আমি এখনই এইটির জন্য কোনও রেফারেন্স খুঁজে পাই না।
{-1,1}
NormalDistribution[]
প্রথমটি হ'ল দুটি অনিয়ন্ত্রিত গৌসিয়ানদের জন্য যৌথ ঘনত্ব, দ্বিতীয়টি রূপান্তরাধীন এবং তৃতীয়টি সাদা করার পরে। অনুশীলনে কেবলমাত্র 2 এবং 3 পদক্ষেপ দৃশ্যমান।