বাইক্লাস্টারিং দিয়ে শুরু করা


9

আমি বাইক্লাস্টারগুলিতে কিছু নৈমিত্তিক ইন্টারনেট গবেষণা করে চলেছি। (আমি বেশ কয়েকবার উইকি নিবন্ধটি পড়েছি।) এখনও অবধি মনে হচ্ছে কয়েকটি সংজ্ঞা বা মান পরিভাষা রয়েছে।

  1. আমি ভাবছিলাম যে কোনও মানক কাগজপত্র বা বই আছে যা বাইক্লাস্টার সন্ধানের জন্য অ্যালগরিদমে আগ্রহী যে কেউ পড়তে হবে।

  2. ক্ষেত্রের শিল্পের অবস্থা কী বলা যায়? জেনেটিক অ্যালগরিদম ব্যবহার করে দ্বিখণ্ডক আবিষ্কার করার ধারণায় আমি আগ্রহী ছিলাম, তাই আমি অন্যান্য পদ্ধতির প্রসঙ্গে বিশেষত সেই পদ্ধতির বিষয়ে মন্তব্যগুলির প্রশংসা করব।

  3. সাধারণত ক্লাস্টারিংয়ে, লক্ষ্য হ'ল ডেটা-সেটগুলিকে এমন গ্রুপগুলিতে বিভক্ত করা যেখানে প্রতিটি উপাদান কোনও না কোনও গ্রুপে থাকে। বাইক্লাস্টার অ্যালগোরিদমগুলিও সমস্ত উপাদানকে একটি নির্দিষ্ট গোষ্ঠীতে রাখার চেষ্টা করে?

উত্তর:


16

আমি কখনই এটি সরাসরি ব্যবহার করি নি, তাই আমি কেবল সেই কৌশল সম্পর্কে আমার কিছু কাগজপত্র এবং সাধারণ চিন্তাভাবনাগুলি ভাগ করতে পারি (যা মূলত আপনার প্রশ্নগুলির সমাধান 1 এবং 3)।

বাইক্লাস্টারিং সম্পর্কে আমার সাধারণ বোধগম্যতা মূলত জেনেটিক স্টাডিজ (2-6) থেকে আসে যেখানে আমরা জিনের গুচ্ছ এবং ব্যক্তিদের গোষ্ঠীগুলির জন্য হিসাব চেয়েছি: সংক্ষেপে, আমরা এক সাথে জিনের প্রকাশের অনুরূপ প্রোফাইল ভাগ করে নেওয়ার দলগুলির সন্ধান করছি (এটি সম্পর্কিত হতে পারে) উদাহরণস্বরূপ) রোগের রাজ্যে) এবং জিনগুলি যা জিন প্রোফাইলিংয়ের এই ধরণে অবদান রাখে। জৈবিক "বিস্তৃত" ডেটাসেটের জন্য শিল্পের রাজ্যের একটি সমীক্ষা পার্ডালোসের স্লাইডস, বিকলস্টারিংয়ে পাওয়া যায় । নোট করুন যে একটি আর প্যাকেজ রয়েছে, মাইক্রোয়ারে ডেটাতে অ্যাপ্লিকেশন সহ বিক্লাস্ট

প্রকৃতপক্ষে, আমার প্রাথমিক ধারণাটি ছিল ক্লিনিকাল ডায়াগনোসিসে এই পদ্ধতিটি প্রয়োগ করা, কারণ এটি একাধিক ক্লাস্টারে বৈশিষ্ট্য বা ভেরিয়েবল স্থাপনের অনুমতি দেয় যা সেমিয়োলজিকাল দৃষ্টিভঙ্গি থেকে আকর্ষণীয় কারণ ক্লাস্টার একসাথে সিন্ড্রোম সংজ্ঞা দেওয়ার অনুমতি দেয় তবে কিছু লক্ষণ হতে পারে বিভিন্ন রোগে ওভারল্যাপ একটি ভাল আলোচনার সন্ধান পাওয়া যাবে ক্রেমার এট।, কমার্বিডিটি: একটি নেটওয়ার্কের দৃষ্টিকোণ (আচরণ এবং মস্তিষ্ক বিজ্ঞান 2010, 33, 137-193)।

কিছুটা সম্পর্কিত কৌশল হ'ল সহযোগী ফিল্টারিং । সু এবং খোশগোফটার ( কৃত্রিম বুদ্ধিমত্তার অগ্রযাত্রা , ২০০৯) দ্বারা একটি ভাল পর্যালোচনা উপলব্ধ করা হয়েছিল : সহযোগী ফিল্টারিং কৌশলগুলির একটি সমীক্ষা । অন্যান্য উল্লেখগুলি শেষে তালিকাভুক্ত করা হয়েছে। বাজার-ঝুড়ির সমস্যার উদাহরণ হিসাবে ঘন ঘন আইটেমসেট বিশ্লেষণও এর সাথে যুক্ত থাকে তবে আমি কখনই এটি তদন্ত করেছিলাম না। কো-ক্লাস্টারিংয়ের আরেকটি উদাহরণ হ'ল আমরা যখন পাঠ্য খনির মতো একই সাথে শব্দ এবং নথিগুলি ক্লাস্টার করতে চাই, যেমন illিলন (2001)। দ্বিপক্ষীয় বর্ণালী গ্রাফ বিভাজন ব্যবহার করে কো-ক্লাস্টারিং নথি এবং শব্দProc। কেডিডি , পৃষ্ঠা 269-2274।

কিছু সাধারণ রেফারেন্স সম্পর্কে, এখানে খুব পরিসংখ্যানের তালিকা নেই যা আমি আশা করি আপনি দরকারী হতে পারেন:

  1. জৈন, একে (২০১০) ডেটা ক্লাস্টারিং: কে-মানে ছাড়িয়ে 50 বছরপ্যাটার্ন রিকগনিশন লেটারস , 31 , 651–666
  2. কারমোনা-সায়েজ এট আল। (2006)। নন-মসৃণ অ-নেতিবাচক ম্যাট্রিক্স ফ্যাক্টেরাইজেশন দ্বারা জিন এক্সপ্রেশন ডেটা বিক্লাস্টারিংবিএমসি বায়োইনফরম্যাটিকস , 7 , 78।
  3. প্রিলিক এট। (2006)। জিনের এক্সপ্রেশন ডেটার জন্য দ্বি-বিভাজন পদ্ধতিগুলির একটি পদ্ধতিগত তুলনা এবং মূল্যায়নবায়োইনফরম্যাটিকস , 22 (9) , 1122-1129। www.tik.ee.ethz.ch/sop/bimax
  4. ডিম্যাগজিও এট আল। (2008)। সিস্টেম জীববিদ্যায় ডেটা ম্যাট্রিকের অনুকূল পুনঃক্রমের মাধ্যমে বিক্লাস্টারিং: কঠোর পদ্ধতি এবং তুলনামূলক অধ্যয়নবিএমসি বায়োইনফরম্যাটিকস , 9 , 458।
  5. সান্তামারিয়া এট আল। (2008)। BicOverlapper: দ্বি-বিভাজন দর্শনের জন্য একটি সরঞ্জামবায়োইনফরম্যাটিকস , 24 (9) , 1212-1213।
  6. ম্যাডেইরা , এসসি এবং অলিভিরা, আ.লীগ (2004) জৈবিক তথ্য বিশ্লেষণের জন্য বিক্লাস্টার অ্যালগরিদম: একটি সমীক্ষাআইইইই ট্রান্স Comput। বাইওল। Bioinform। , 1 , 24-45।
  7. বদিয়া, এল। (২০০৯)। ওভারল্যাপিং বিকলস্টারগুলির জন্য সাধারণীকরণ ক্লাস্টারগ্রামগুলি । IJCAI
  8. সিমোনিডিস, পি। (2006) নিকটতম-বিকলস্টারস সহযোগী ফিল্টারিং । WEBKDD

1
দুর্দান্ত উত্তর। আমার যদি অন্য ভোট হয় তবে আমি এই উত্তরের জন্য আবারও ভোট দিতাম।
হেনরি বি

@ সিএইচএল পার্ডালোস স্লাইডগুলির প্রথম লিঙ্কটি মারা গেছে বলে মনে হচ্ছে। কেউ বিকল্প অবস্থান সম্পর্কে জানেন?
এরিক

@ এরিক স্লাইডগুলি থেকে বেশিরভাগ উপাদান একই লেখকের ফ্র্যাকশনাল 0-11 প্রোগ্রামিংয়ের মাধ্যমে কনসিস্টেন্ট বাইক্লাস্টারিংয়ে পাওয়া যাবে । (আমি আমার মৃত লিঙ্কটির অনুলিপি সহ স্লাইডগুলির সামগ্রীটি যাচাই করেছি))
chl

4

এখানে একটি ভাল সমীক্ষা / পর্যালোচনা:

স্ট্যানিস্লাভ বুসিগিন, ওলেগ প্রকোপায়েভ, এবং পানোস এম পার্ডালোস। ডেটা মাইনিংয়ে দ্বিখণ্ডিত । কম্পিউটার ও অপারেশনস গবেষণা, 35 (9): 2964–2987, সেপ্টেম্বর ২০০৮।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.