সুতরাং কেন বিনাশকে সর্বদা এড়ানো উচিত সে সম্পর্কে কয়েকটি পোস্ট পড়েছি । এই লিঙ্কটি হ'ল দাবিটির জন্য একটি জনপ্রিয় রেফারেন্স ।
মূল পটকাটি হ'ল বেনিং পয়েন্টগুলি (বা কাটপয়েন্টস) বরং স্বেচ্ছাচারী এবং ফলস্বরূপ তথ্যের ক্ষতির কারণ এবং সেই স্প্লাইনগুলি অগ্রাধিকার দেওয়া উচিত।
যাইহোক, আমি বর্তমানে স্পটিফাই এপিআইয়ের সাথে কাজ করছি, যা তাদের বেশ কয়েকটি বৈশিষ্ট্যের জন্য নিবিড় আত্মবিশ্বাসের ব্যবস্থা করে।
"ইন্সট্রুমুলেশন" এর একটি বৈশিষ্ট্য, উল্লেখগুলি উল্লেখ করে:
একটি ট্র্যাকের ভোকাল নেই কিনা তা ভবিষ্যদ্বাণী করে। "ওহ" এবং "আহ" শব্দগুলি এই প্রসঙ্গে সহায়ক হিসাবে বিবেচিত হয়। র্যাপ বা কথ্য শব্দ ট্র্যাকগুলি স্পষ্টভাবে “ভোকাল”। উপকরণের মানটি যত কাছাকাছি হয় 1.0, ট্র্যাকের কোনও ভোকাল সামগ্রী নেই এর বেশি সম্ভাবনা। 0.5 এর উপরে মানগুলি ইন্সট্রুমেন্টাল ট্র্যাকগুলি উপস্থাপনের উদ্দেশ্যে তৈরি করা হয় তবে মানটি 1.0 এর কাছে যাওয়ার সাথে আত্মবিশ্বাস বেশি higher
আমার ডেটাগুলির খুব বাম দিকের বিতরণ দেওয়া (নমুনাগুলির প্রায় 90% সবেমাত্র 0 এর উপরে, আমি এই বৈশিষ্ট্যটিকে দুটি শ্রেণীবদ্ধ বৈশিষ্ট্যে রূপান্তরিত করে বোধগম্য হতে পেরেছি: "উপকরণ" (0.5% এর চেয়ে বেশি মানের সমস্ত নমুনা) এবং "অ-মাসিক "(0.5 এর নিচে মান সহ সমস্ত নমুনার জন্য)।
এটা কি ভুল? এবং বিকল্পটি কী হত, যখন আমার প্রায় সমস্ত (ধারাবাহিক) ডেটা একক মানের চারপাশে ঘুরছে? স্প্লাইজ সম্পর্কে আমি যা বুঝি সেগুলি থেকে তারা শ্রেণিবদ্ধকরণ সমস্যাগুলি (আমি কী করছি) নিয়ে কাজ করবে না।