আমি আশা করি এই প্রশ্নটি এই সাইটে সবচেয়ে উপযুক্ত ...
পাইথনে, সাধারণত শ্রেণির নামটি প্রথম অক্ষর হিসাবে মূল অক্ষরটি ব্যবহার করে সংজ্ঞায়িত করা হয়
class Vehicle:
...
যাইহোক, মেশিন লার্নিং মাঠে, প্রায়ই বার প্রশিক্ষণ এবং পরীক্ষার তথ্য হিসাবে সংজ্ঞায়িত করা হয় X
এবং Y
- না x
এবং y
। উদাহরণস্বরূপ, আমি এখন ক্যারাসের এই টিউটোরিয়ালটি পড়ছি , তবে এটি এর ভেরিয়েবল হিসাবে X
এবং ব্যবহার করে Y
:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
এগুলিকে কেন মূলধন হিসাবে সংজ্ঞায়িত করা হয়? মেশিন লার্নিং ফিল্ডের মধ্যে কি কোনও কনভেনশন (কমপক্ষে পাইথন) রয়েছে যে এই ভেরিয়েবলগুলি সংজ্ঞায়িত করার জন্য মূলধনপত্রটি ব্যবহার করা ভাল?
অথবা সম্ভবত লোকেরা মেশিন লার্নিংয়ের ক্ষেত্রে উচ্চ বনাম লোয়ার কেস ভেরিয়েবলগুলিকে আলাদা করতে পারে?
বাস্তবে একই টিউটোরিয়াল পরে নিম্নলিখিতগুলির মতো এই ভেরিয়েবলগুলি পৃথক করে:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)