এটি একটি বিস্তীর্ণ প্রশ্ন, সুতরাং এটি সম্পূর্ণ উত্তর হওয়ার উদ্দেশ্যে নয়, তবে আশা করা যায় এটি ডেটা সায়েন্সের ক্ষেত্রে কাজের জন্য সেরা সরঞ্জাম নির্ধারণের আশপাশে সাধারণ অনুশীলনকে অবহিত করতে সহায়তা করতে পারে। সাধারণত, আমার এই জায়গাগুলির কোনও সরঞ্জামের ক্ষেত্রে যখন যোগ্যতার সন্ধান করা হয় তার তুলনামূলকভাবে একটি সংক্ষিপ্ত তালিকা রয়েছে। কোনও নির্দিষ্ট ক্রমে তারা হলেন:
- পারফরম্যান্স : মূলত ডেটা সায়েন্সের সবচেয়ে গুরুত্বপূর্ণ কাজ হওয়ায় ভাষা ম্যাট্রিক্সের গুণকে কত তাড়াতাড়ি ফুটিয়ে তোলে।
- স্কেলিবিলিটি : কমপক্ষে ব্যক্তিগতভাবে আমার জন্য, এটি বিতরণ ব্যবস্থা তৈরির সুবিধার্থে নেমে আসে। এটি এমন কোথাও যেখানে
Juliaসত্যিকারের মতো ভাষা জ্বলজ্বল করে।
- সম্প্রদায় : যে কোনও ভাষার সাথে আপনি সত্যই সক্রিয় একটি সম্প্রদায় খুঁজছেন যা আপনি যে কোনও সরঞ্জাম ব্যবহার করে আটকে গেলে আপনাকে সহায়তা করতে পারে। এটি
pythonঅন্যান্য বেশিরভাগ ভাষার তুলনায় খুব এগিয়ে চলেছে।
- নমনীয়তা : আপনি যে ভাষা ব্যবহার করেন তা সীমাবদ্ধ হওয়ার চেয়ে খারাপ আর কিছুই নয়। এটি প্রায়শই ঘটে না, তবে গ্রাফের কাঠামোগুলিগুলিতে প্রতিনিধিত্ব করার চেষ্টা করা
haskellএকটি কুখ্যাত ব্যথা এবং Juliaএ জাতীয় ভাষা হওয়ার ফলে প্রচুর কোড আর্কিটেকচার বেদনাতে ভরা হয়।
- ব্যবহারের সহজতা : আপনি যদি বৃহত্তর পরিবেশে কিছু ব্যবহার করতে চান তবে আপনি নিশ্চিত করতে চান যে সেটআপটি একটি সরলসাধ্য এবং এটি স্বয়ংক্রিয়ভাবে চালিত হতে পারে। অর্ধ ডজন মেশিনে একটি ফাইনিক বিল্ড স্থাপনের চেয়ে খারাপ আর কিছুই নয়।
পারফরম্যান্স এবং স্কেল্যাবিলিটি সম্পর্কে এখানে প্রচুর নিবন্ধ রয়েছে, তবে সাধারণভাবে আপনি ভাষাগুলির মধ্যে সম্ভবত 5-10x এর পারফরম্যান্সের পার্থক্যটির দিকে তাকিয়ে যাচ্ছেন, যা আপনার নির্দিষ্ট প্রয়োগের উপর নির্ভর করে বা নাও পারে। যতদূর জিপিইউ ত্বরণ যায়, cudamatসাথে কাজ এটা পাবার সত্যিই একটি বিজোড় উপায় python, এবং cudaসাধারণভাবে গ্রন্থাগার জিপিইউ ত্বরণ অনেক বেশী প্রবেশযোগ্য তুলনায় এটি ব্যবহার করা হয় করেছে।
সম্প্রদায় এবং নমনীয়তা উভয়ের জন্য আমি যে দুটি প্রাথমিক মেট্রিক ব্যবহার করি তা হ'ল ভাষার প্যাকেজ ম্যানেজার এবং এসও এর মতো সাইটে ভাষা সংক্রান্ত প্রশ্নগুলি। যদি প্রচুর পরিমাণে উচ্চ-মানের প্রশ্ন এবং উত্তর থাকে তবে সম্প্রদায়টি সক্রিয় রয়েছে এটি একটি ভাল লক্ষণ। এই প্যাকেজগুলির প্যাকেজের সংখ্যা এবং সাধারণ ক্রিয়াকলাপও এই মেট্রিকের জন্য ভাল প্রক্সি হতে পারে।
ব্যবহারের সহজতা যতদূর যায়, আমি দৃ firm় বিশ্বাসী যে প্রকৃতপক্ষে জানার একমাত্র উপায় হ'ল প্রকৃতপক্ষে নিজেকে সেট আপ করা। ডেটা সায়েন্স সরঞ্জামগুলির প্রচুর আশেপাশে প্রচুর কুসংস্কার রয়েছে, বিশেষত ডাটাবেস এবং বিতরণকৃত কম্পিউটিং আর্কিটেকচারের মতো জিনিস, তবে কেবল নিজের তৈরি না করেই কোনও সেটআপ স্থাপন করা এবং মোতায়েন করা খুব সহজ বা শক্ত কিনা তা সত্যই জানার উপায় নেই।