এটি একটি বিস্তীর্ণ প্রশ্ন, সুতরাং এটি সম্পূর্ণ উত্তর হওয়ার উদ্দেশ্যে নয়, তবে আশা করা যায় এটি ডেটা সায়েন্সের ক্ষেত্রে কাজের জন্য সেরা সরঞ্জাম নির্ধারণের আশপাশে সাধারণ অনুশীলনকে অবহিত করতে সহায়তা করতে পারে। সাধারণত, আমার এই জায়গাগুলির কোনও সরঞ্জামের ক্ষেত্রে যখন যোগ্যতার সন্ধান করা হয় তার তুলনামূলকভাবে একটি সংক্ষিপ্ত তালিকা রয়েছে। কোনও নির্দিষ্ট ক্রমে তারা হলেন:
- পারফরম্যান্স : মূলত ডেটা সায়েন্সের সবচেয়ে গুরুত্বপূর্ণ কাজ হওয়ায় ভাষা ম্যাট্রিক্সের গুণকে কত তাড়াতাড়ি ফুটিয়ে তোলে।
- স্কেলিবিলিটি : কমপক্ষে ব্যক্তিগতভাবে আমার জন্য, এটি বিতরণ ব্যবস্থা তৈরির সুবিধার্থে নেমে আসে। এটি এমন কোথাও যেখানে
Julia
সত্যিকারের মতো ভাষা জ্বলজ্বল করে।
- সম্প্রদায় : যে কোনও ভাষার সাথে আপনি সত্যই সক্রিয় একটি সম্প্রদায় খুঁজছেন যা আপনি যে কোনও সরঞ্জাম ব্যবহার করে আটকে গেলে আপনাকে সহায়তা করতে পারে। এটি
python
অন্যান্য বেশিরভাগ ভাষার তুলনায় খুব এগিয়ে চলেছে।
- নমনীয়তা : আপনি যে ভাষা ব্যবহার করেন তা সীমাবদ্ধ হওয়ার চেয়ে খারাপ আর কিছুই নয়। এটি প্রায়শই ঘটে না, তবে গ্রাফের কাঠামোগুলিগুলিতে প্রতিনিধিত্ব করার চেষ্টা করা
haskell
একটি কুখ্যাত ব্যথা এবং Julia
এ জাতীয় ভাষা হওয়ার ফলে প্রচুর কোড আর্কিটেকচার বেদনাতে ভরা হয়।
- ব্যবহারের সহজতা : আপনি যদি বৃহত্তর পরিবেশে কিছু ব্যবহার করতে চান তবে আপনি নিশ্চিত করতে চান যে সেটআপটি একটি সরলসাধ্য এবং এটি স্বয়ংক্রিয়ভাবে চালিত হতে পারে। অর্ধ ডজন মেশিনে একটি ফাইনিক বিল্ড স্থাপনের চেয়ে খারাপ আর কিছুই নয়।
পারফরম্যান্স এবং স্কেল্যাবিলিটি সম্পর্কে এখানে প্রচুর নিবন্ধ রয়েছে, তবে সাধারণভাবে আপনি ভাষাগুলির মধ্যে সম্ভবত 5-10x এর পারফরম্যান্সের পার্থক্যটির দিকে তাকিয়ে যাচ্ছেন, যা আপনার নির্দিষ্ট প্রয়োগের উপর নির্ভর করে বা নাও পারে। যতদূর জিপিইউ ত্বরণ যায়, cudamat
সাথে কাজ এটা পাবার সত্যিই একটি বিজোড় উপায় python
, এবং cuda
সাধারণভাবে গ্রন্থাগার জিপিইউ ত্বরণ অনেক বেশী প্রবেশযোগ্য তুলনায় এটি ব্যবহার করা হয় করেছে।
সম্প্রদায় এবং নমনীয়তা উভয়ের জন্য আমি যে দুটি প্রাথমিক মেট্রিক ব্যবহার করি তা হ'ল ভাষার প্যাকেজ ম্যানেজার এবং এসও এর মতো সাইটে ভাষা সংক্রান্ত প্রশ্নগুলি। যদি প্রচুর পরিমাণে উচ্চ-মানের প্রশ্ন এবং উত্তর থাকে তবে সম্প্রদায়টি সক্রিয় রয়েছে এটি একটি ভাল লক্ষণ। এই প্যাকেজগুলির প্যাকেজের সংখ্যা এবং সাধারণ ক্রিয়াকলাপও এই মেট্রিকের জন্য ভাল প্রক্সি হতে পারে।
ব্যবহারের সহজতা যতদূর যায়, আমি দৃ firm় বিশ্বাসী যে প্রকৃতপক্ষে জানার একমাত্র উপায় হ'ল প্রকৃতপক্ষে নিজেকে সেট আপ করা। ডেটা সায়েন্স সরঞ্জামগুলির প্রচুর আশেপাশে প্রচুর কুসংস্কার রয়েছে, বিশেষত ডাটাবেস এবং বিতরণকৃত কম্পিউটিং আর্কিটেকচারের মতো জিনিস, তবে কেবল নিজের তৈরি না করেই কোনও সেটআপ স্থাপন করা এবং মোতায়েন করা খুব সহজ বা শক্ত কিনা তা সত্যই জানার উপায় নেই।