আমাকে প্রথমে স্পষ্ট করে বলি যে আমি একটি প্রোগ্রামার এবং ডাটাবেস বিকাশকারী অবস্থান থেকে ডেটা সায়েন্সে আমার যাত্রা শুরু করছি। আমি 10 বছরের ডেটা বিজ্ঞান বিশেষজ্ঞ বা কোনও পরিসংখ্যান godশ্বর নই। তবে আমি বিশ্বব্যাপী বৃহত্তর ক্লায়েন্টদের সাথে কাজ করে এমন একটি সংস্থার জন্য ডেটা বিজ্ঞানী এবং বড় ডেটাসেটগুলি করি do
আমার অভিজ্ঞতা থেকে, ডেটা বিজ্ঞানী তাদের কাজটি সম্পন্ন করার জন্য প্রয়োজনীয় সমস্ত সরঞ্জাম ব্যবহার করে। এক্সেল, আর, এসএএস, পাইথন এবং আরও অনেকগুলি ভাল ডেটা বিজ্ঞানীর জন্য একটি সরঞ্জাম বাক্সে রয়েছে। ডেটা বিশ্লেষণ করতে এবং ক্রাচ করতে সর্বোত্তম বিভিন্ন ধরণের সরঞ্জাম ব্যবহার করতে পারে।
অতএব, যদি আপনি নিজেকে পাইথনের সাথে আর এর তুলনা করে দেখেন, তবে আপনি সম্ভবত ডেটা বিজ্ঞানের জগতে এটি সমস্ত ভুল করছেন। একে অপরকে ব্যবহার করা যখন বোধগম্য হয় তখন ভাল ডেটা বিজ্ঞানী উভয়ই ব্যবহার করেন। এটি এক্সেলের ক্ষেত্রেও প্রযোজ্য।
আমি মনে করি যে সবকিছুতে দুর্দান্ত থাকাকালীন এমন অনেকগুলি সরঞ্জাম এবং ভাষায় অভিজ্ঞতা থাকতে পারে এমন কাউকে খুঁজে পাওয়া বরং বরং কঠিন। আমি আরও মনে করি যে এটি বিশেষত ডেটা বিজ্ঞানীকে খুঁজে পাওয়া শক্ত হবে যা কেবল জটিল অ্যালগরিদমগুলিই প্রোগ্রাম করতে পারে না তবে এটি কীভাবে একটি পরিসংখ্যানগত দিক থেকেও ব্যবহার করতে হয় তাও জানেন।
আমি যে ডেটা বিজ্ঞানী নিয়ে কাজ করেছি তার বেশিরভাগই প্রায় ২ টি স্বাদ নিয়ে আসেন। যাঁরা প্রোগ্রাম করতে পারেন এবং যা তারা পারেন না। আমি ডেটা সায়েন্টিস্টের সাথে খুব কমই কাজ করি যা পাইথনে ডেটা টানতে পারে, পান্ডার মতো কিছু দিয়ে এটিকে চালিত করতে পারে, আর এর ডেটাতে একটি মডেল ফিট করে এবং তারপরে সপ্তাহের শেষে এটি পরিচালনায় উপস্থাপন করতে পারে।
মানে, আমি জানি তাদের অস্তিত্ব আছে। আমি ওয়েব স্ক্র্যাপার বিকাশকারী ছেলেদের কাছ থেকে অনেকগুলি ডেটা সায়েন্স ব্লগ পড়েছি, এটি হ্যাডোপের দিকে ঠেলে দিয়ে, পাইথনে এটি আবার টেনে আছি, জটিল জিনিসগুলিকে প্রোগ্রামিং করেছি এবং আর এর মাধ্যমে বুটে চালিয়ে যাচ্ছি। তারা আছে. তারা বাইরে আছে। আমি খুব বেশি দৌড়ে যাইনি যে এই সমস্ত কিছুই করতে পারে। এটি সম্ভবত আমার এলাকা যদিও?
সুতরাং, তার মানে কি কেবলমাত্র একটি জিনিসকেই খারাপ বিশেষায়িত করা? না। আমার প্রচুর বন্ধুরা কেবল একটি মূল ভাষায় বিশেষজ্ঞ এবং এটিকে হত্যা করে। আমি প্রচুর ডেটা ছেলেরা জানি যারা কেবল আর জানেন এবং এটি মেরে ফেলেন। আমি প্রচুর লোককেও জানি যারা ডেটা বিশ্লেষণের জন্য কেবল এক্সেল ব্যবহার করেন কারণ বেশিরভাগ নন-ডেটা বিজ্ঞানী বিজ্ঞানী খুলতে এবং ব্যবহার করতে পারেন (বিশেষত বি 2 বি সংস্থাগুলিতে)। আপনার সত্যিই যে প্রশ্নের উত্তর দিতে হবে তা হল যদি এই একটি জিনিসই এই অবস্থানের জন্য আপনার প্রয়োজন হয় তবে? এবং সবচেয়ে বড় কথা, তারা কি নতুন জিনিস শিখতে পারে?
দ্রষ্টব্য
ডেটা সায়েন্স কেবলমাত্র "বিগ ডেটা" বা নোএসকিউএল-তে সীমাবদ্ধ নয়।