ক্লাস্টারিং জড় সূত্র বিজ্ঞান শিখতে


9

আমি পান্ডা এবং সাইকিট শিখার সাহায্যে পাইথান ক্লাস্টারিং-এর একটি কামিয়ানদের কোড করতে চাই। ভাল কে নির্বাচন করতে, আমি তিবশিরানী এবং আল 2001 ( পিডিএফ ) থেকে গ্যাপ পরিসংখ্যান কোড করতে চাই ।

আমি জানতে চাই যে আমি সাইকিট থেকে জড়তা_ ফলাফলটি ব্যবহার করতে পারি এবং সমস্ত দূরত্বের গণনা পুনরায় পুনর্নির্মাণ না করে ফাঁক পরিসংখ্যান সূত্রটি অভিযোজিত করতে পারি কিনা ।

কেউ কি স্কাইকিটে ব্যবহৃত জড় সূত্রটি জানেন / উচ্চ স্তরের দূরত্ব ফাংশনগুলি ব্যবহার করে ফাঁক পরিসংখ্যান পুনরুদ্ধারের একটি সহজ উপায় জানেন?


আমি মনে করি এই প্রশ্নের সিভিতে অন টপিক থাকার জন্য পর্যাপ্ত পরিসংখ্যানীয় সামগ্রী রয়েছে তবে নোট করুন যে এটির জন্য মোটামুটি পরিশীলিত প্রোগ্রামিং এবং পাইথন জ্ঞানও প্রয়োজন। একটি ভাল উত্তর পাওয়া কঠিন হতে পারে। আপনি সিউডোকোডের জন্যও নিষ্পত্তি করতে ইচ্ছুক / অনুরোধ করতে চাইতে পারেন , এবং / অথবা আপনার এই প্রশ্নটি পাইথন প্রোগ্রামিংয়ের দিকগুলি সম্পর্কে স্ট্যাক ওভারফ্লোতে স্ট্যাটিস্টিকাল দিকগুলি এবং 1 অংশ সম্পর্কে এখানে 2 ভাগে বিভক্ত করতে হবে । (বা সম্ভবত না, আমি নিশ্চিতভাবে জানি না, তবে আমি আপনাকে কেবল সুষ্ঠু সতর্কতা দিতে চাই; আমরা এটি কীভাবে হয় তা দেখতে পাব))
গং - মনিকা পুনরায়

1
এই প্রশ্নের "জড়তা" শব্দটি সংজ্ঞায়িত করা দরকার। মনে হচ্ছে এর মধ্যে এটি মুদ্রিত python
ttnphns

উত্তর:


6

আমি অনুমান করি যে আমি আমার উত্তরটি কুমিয়ান ক্লাস্টারিংয়ের জন্য পেয়েছি:

গিট সোর্স কোডটি দেখে আমি দেখতে পেলাম যে সাইকিট শিখার জন্য, জড়তাটি প্রতিটি বিন্দুর নিকটতম সেন্ট্রয়েড অর্থাৎ তার নির্ধারিত ক্লাস্টারের জন্য স্কোয়ার দূরত্বের যোগফল হিসাবে গণনা করা হয়। সুতরাং যেখানে নির্ধারিত ক্লাস্টারের সেন্ট্রয়েড এবং বর্গক্ষেত্রের দূরত্ব। I=i(d(i,cr))crd

এখন ফাঁক পরিসংখ্যানের সূত্রে যেখানে ক্লাস্টার সমস্ত পয়েন্টের মধ্যে স্কোয়ার দূরত্বের যোগফল ।

Wk=r=1k1(2nr)Dr
Drr

প্রবর্তনের দ্বারা , স্কোয়ারড দূরত্ব সূত্রে ( ক্লাস্টার centroid হচ্ছে স্থানাঙ্ক), আমি একটি শব্দ আছে নিষ্ক্রিয়তা সাথে সঙ্গতিপূর্ণ (scikit হিসেবে) + একটি শব্দ যে যদি প্রতিটি disappears প্রতিটি ক্লাস্টার barycentre হয় (যা এটি কামিয়ানদের মধ্যে থাকার কথা)। সুতরাং আমি অনুমান করি যে আসলে জড়তা k+cccrcWk

আমার এখনও দুটি প্রশ্ন আছে:

  1. আপনি কি মনে করেন আমার ক্যালকুলাসটি সঠিক? (উদাহরণস্বরূপ, আমি জানি না এটি হায়ারারিকিকাল ক্লাস্টারিংয়ের জন্য রয়েছে কিনা))
  2. আমি যদি উপরে সঠিক হয়ে থাকি তবে আমি ফাঁক পরিসংখ্যানকে কোড করেছি (অনুমান এবং ক্লাস্টারিংয়ের মধ্যে লগ জড়তার পার্থক্য হিসাবে) এবং এটি বিশেষত আইরিস ডেটাসেটটিতে খারাপভাবে সম্পাদন করে, কেউ কি এটি চেষ্টা করেছে?

2
আপনার উত্তরে প্রশ্ন না দেওয়াই ভাল। যদি এটি সত্যিই আপনার প্রশ্নের উত্তর না হয় তবে আসল প্রশ্নটি পরিষ্কার করার জন্য কেবল একটি আংশিক সমাধান, আপনার প্রশ্নটি সম্পাদনা করা এবং এই তথ্যটি পেস্ট করা ভাল
গুং - মনিকা

1
@ স্ক্র্যাচ আপনি কি আইরিস ডেটা সেটটিতে কাজ করতে ফাঁক পরিসংখ্যানটির অজগর বাস্তবায়ন পেতে পারেন? আমি একই ইস্যু নিয়ে লড়াই করছি।
Zelazny7

হ্যাঁ আমি কয়েক মাস আগে একটি কোড করেছি। আমি কীভাবে আপনাকে এটি পাঠাতে পারি?
স্ক্র্যাচ

1
সূত্রটি এই ?
Wk=r=1kDr(2nr)
বিশ্বনাথ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.