স্বতন্ত্র উপাদান বিশ্লেষণ সম্পাদন করার জন্য প্রাক প্রাক-প্রক্রিয়াজাত পদক্ষেপগুলি কী কী?


17

পরবর্তী সময়ে একটি স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) সম্পাদন করার জন্য আমার তরঙ্গকার্যগুলির প্রসেসোসিংয়ের সঠিক পদক্ষেপগুলি কী কী ? আমি কীভাবে বুঝতে পারি, যদিও এর আরও ব্যাখ্যা আঘাত না করে তবে আমি কেন এটিতে আগ্রহী।


আপনার প্রিপ্রসেসিং কেন প্রয়োজন তা আমি নিশ্চিত নই। কোন বিশেষ কারণ আছে?
ফোনন

@ ফনন আমি তদন্তকারীদের মুখোমুখি হয়েছি যারা আইসিএ করার আগে তাদের ডেটা বর্ধন করেছে। আমি কেবল ভাবলাম যে কোনও মানক পদ্ধতি আছে কিনা?
jonsca

অনেক আগ্রহব্যাঞ্জক. আমি একটি গঠনমূলক উত্তর দেখতে চাই।
ফোনন

1
ইইজি সংকেতগুলিতে বর্ণালী বিশ্লেষণের ক্ষেত্রে, লোকেরা বর্ণালীটির আকারের প্রভাবের প্রভাবকে হ্রাস করতে সাদা করে তোলে, যা প্রায়শই উচ্চ ফ্রিকোয়েন্সিগুলিতে আকর্ষণীয় জিনিসগুলি আড়াল করে। পরিপূরক সামগ্রীতে এখানে কমপক্ষে একটি সামান্য আলোচনা আছে । বিশেষত আইসিএর আগে এটি সাধারণ কৌশল কিনা তা নিশ্চিত না। আপনার আবেদনটি কি ইইজি / এমইজি / এলএফপি সংকেত? আইসিএ করেন এমন কেউ হয়তো পুরো উত্তরটি খুঁজে পেতে পারেন, যদি আমার কুঁচি ঠিক থাকে। আকর্ষণীয় প্রশ্ন - আমি এটি পড়তে হবে। 1/f
ইমএলসোগ্রাগ

1
@ জিগিলি এটিও প্রশ্নের একটি অংশ। কোনটি সাধারণ পদক্ষেপ হিসাবে বিবেচিত হয়?
jonsca

উত্তর:


15

স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) এর পরিসংখ্যানগতভাবে স্বতন্ত্র এবং সবচেয়ে গুরুত্বপূর্ণ, অ-গাউশিয়ান উপাদানগুলির একটি রৈখিক মিশ্রণ পৃথক করতে ব্যবহৃত হয় । একটি গোলমুক্ত আইসিএর জন্য আদর্শ মডেল

x=As

যেখানে পর্যবেক্ষণ বা তথ্য ভেক্টর হয়, গুলি করা হয় একটি উৎস সংকেত / মূল উপাদান (অ-গসিয়ান) এবং একটি একটি রূপান্তর ভেক্টর যে সংজ্ঞায়িত উপাদান সংকেত রৈখিক মেশানো। সাধারণত, এবং অজানা।xsAAs

প্রাক প্রক্রিয়াকরণ

আইসিএতে দুটি প্রধান প্রাক-প্রক্রিয়াজাতকরণ কৌশল রয়েছে, যাকে কেন্দ্র করে এবং সাদা করা / গোলাকার করা হয়। প্রাক প্রক্রিয়াজাতকরণের প্রাথমিক কারণগুলি হ'ল:

  • অ্যালগরিদমের সরলীকরণ
  • সমস্যার মাত্রিকতা হ্রাস
  • অনুমান করার জন্য প্যারামিটারের সংখ্যা হ্রাস।
  • ডেটা সেটগুলির হাইলাইটিং বৈশিষ্ট্যগুলি গড় এবং covariance দ্বারা তাত্ক্ষণিকভাবে ব্যাখ্যা করা হয়নি।

জি লি এবং জে জাংয়ের পরিচিতি থেকে, "স্পেরিং এবং এর বৈশিষ্ট্যগুলি", দ্য ইন্ডিয়ান জার্নাল অফ স্ট্যাটিস্টিকস, খণ্ড। 60, সিরিজ এ, প্রথম খণ্ড, পৃষ্ঠা 119-133, 1998:

আউটলিয়ার্স, ক্লাস্টার বা অন্যান্য ধরণের গ্রুপ এবং বক্ররেখার কাছাকাছি ঘনত্ব বা তলদেশে নন probably সম্ভবত গুরুত্বপূর্ণ বৈশিষ্ট্য যা ডেটা বিশ্লেষকদের আগ্রহী। এগুলি সাধারণভাবে নমুনার গড় এবং কোভেরিয়েন্স ম্যাট্রিক্স সম্পর্কে জ্ঞান অর্জনের মাধ্যমে পাওয়া যায় না। এই পরিস্থিতিতে, ওকে আলাদা করা বাঞ্চনীয় the গড় এবং কোভেরিয়েন্সের ম্যাট্রিকগুলিতে থাকা তথ্যগুলি আমাদের সেই ডেটা-সেটগুলির দিকগুলি পরীক্ষা করতে বাধ্য করে যারা সেগুলি বোঝে at কেন্দ্রীভূতকরণ এবং স্ফিয়ারিং একটি সহজ এবং স্বজ্ঞাত পদ্ধতি যা মধ্য-কোভেরিয়েন্স সম্পর্কিত তথ্যগুলি সরিয়ে দেয় এবং লিনিয়ার পারস্পরিক সম্পর্ক এবং উপবৃত্তাকার আকারের বাইরে কাঠামো হাইলাইট করতে সহায়তা করে এবং তাই প্রায়শই ডেটা সেটগুলির প্রদর্শন বা বিশ্লেষণ অন্বেষণের আগে সঞ্চালিত হয়

1. কেন্দ্রিং:

কেঁদ্রীকরণ একটি খুব সহজ অপারেশন এবং সহজভাবে গড় বিয়োগ বোঝায় । অনুশীলনে, আপনি নমুনা গড়টি ব্যবহার করেন এবং একটি নতুন ভেক্টর তৈরি করেন x c = x - ¯ x , যেখানে ¯ x ডেটার গড়। জ্যামিতিকভাবে, গড়কে বিয়োগ করা স্থানাঙ্কের কেন্দ্রটিকে অনুবাদ করার সমতুল্য । গড়টি সর্বদা ফলাফলের সাথে আবার যুক্ত করা যেতে পারে (এটি সম্ভব কারণ ম্যাট্রিক্সের গুণটি বিভাজন হয়)।E{x}xc=xx¯x¯

2. সাদা করা:

শুভ্রকরণ একটি রূপান্তর এটি একটি পরিচয় সহভেদাংক ম্যাট্রিক্স, অর্থাত, হয়েছে ধর্মান্তরিত তথ্য যেমন যে হয় । সাধারণত, আপনি নমুনা কোভারিয়েন্স ম্যাট্রিক্সের সাথে কাজ করেন,E{xcxcT}=I

Σ^=C.xcxcT

যেখানে যথাযথ নরমালাইজেশন ফ্যাক্টরের ( x এর মাত্রার উপর নির্ভর করে ) কেবল আমার অলস স্থানধারক । একটি নতুন সাদা রঙের ভেক্টর হিসাবে তৈরি করা হয়Cx

xw=Σ^1/2xc

যার একটি সহভেদাংক থাকবে । জ্যামিতিকভাবে, সাদা করা একটি স্কেলিং রূপান্তর। এখানে গাণিতিকের একটি ছোট উদাহরণ রয়েছে:I

s = RandomReal[{-1, 1}, {2000, 2}];
A = {{2, 3}, {4, 2}};
x = s.A;
whiteningMatrix = Inverse@CholeskyDecomposition[Transpose@x.x/Length@x];
y = x.whiteningMatrix;
FullGraphics@GraphicsRow[
  ListPlot[#, AspectRatio -> 1, Frame -> True] & /@ {s, x, y}]

এখানে চিত্র বর্ণনা লিখুন

প্রথম চক্রান্ত দুই অবিশেষে বিতরণ র্যান্ডম ভেক্টর, বা উপাদান যুগ্ম ঘনত্ব । দ্বিতীয়টি রূপান্তর ভেক্টর দ্বারা গুণমানের প্রভাব প্রদর্শন করে । বর্গক্ষেত্রটি স্কিউড হয় এবং একটি রম্বসকে আকার দেওয়া হয়। ঝকঝকে ম্যাট্রিক্সের সাথে গুণ করে, যৌথ ঘনত্বটি আবার একটি বর্গক্ষেত্রের দিকে ফিরে আসে যা মূল থেকে সামান্য ঘোরানো হয়।sA

xw=AwswAw

E{xwxwT}=E{Awsw(Awsw)T}=AwE{swswT}AwT=AwAwT=I

siA

যদি, রূপান্তরের পরে, শূন্যের কাছাকাছি এগেনভ্যালুগুলি থাকে, তবে এগুলি নিরাপদে বাদ দেওয়া যেতে পারে কারণ এটি কেবলমাত্র শব্দ মাত্র এবং "ওভারলিটারিং" এর কারণে অনুমানকে ব্যাহত করবে।

3. অন্যান্য প্রাক প্রক্রিয়াজাতকরণ

কিছু নির্দিষ্ট অ্যাপ্লিকেশন জড়িত অন্যান্য প্রাক প্রক্রিয়াজাতকরণ পদক্ষেপ থাকতে পারে যা একটি উত্তর আবরণ অসম্ভব। উদাহরণস্বরূপ, আমি কয়েকটি নিবন্ধ দেখেছি যা সময়-সিরিজের লগ ব্যবহার করে এবং আরও কয়েকটি যা সময়-সিরিজ ফিল্টার করে। যদিও এটি তাদের বিশেষ প্রয়োগ / শর্তগুলির জন্য উপযুক্ত হতে পারে তবে ফলাফলগুলি সমস্ত ক্ষেত্রেই বহন করে না।

আমি বিশ্বাস করি যে আইসিএ ব্যবহার করা সম্ভব হয় যদি বেশিরভাগ উপাদানগুলির মধ্যে একটি গাউসিয়ান হয়, যদিও আমি এখনই এইটির জন্য কোনও রেফারেন্স খুঁজে পাই না।


কেন এটি "গোলাকরণ" বলা হয়?

এনএন{-1,1}NormalDistribution[]

এখানে চিত্র বর্ণনা লিখুন

প্রথমটি হ'ল দুটি অনিয়ন্ত্রিত গৌসিয়ানদের জন্য যৌথ ঘনত্ব, দ্বিতীয়টি রূপান্তরাধীন এবং তৃতীয়টি সাদা করার পরে। অনুশীলনে কেবলমাত্র 2 এবং 3 পদক্ষেপ দৃশ্যমান।


2
বাহ, এটি সব কিছু নিতে আমার একটু সময় লাগবে, তবে ধন্যবাদ একটি সংক্ষিপ্তসার!
জোনস্কা

দুঃখিত, আমি ভেবেছিলাম আমি এটি ইতিমধ্যে গ্রহণ করেছি।
jonsca
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.