পদগুলি নবীন কারণ এগুলি নতুন
'ডেটা সায়েন্স' ক্ষেত্রে চাকরীর সন্ধানের মাঝামাঝি হওয়ার কারণে, আমি মনে করি যে এখানে দুটি জিনিস চলছে। প্রথমত, চাকরিগুলি নতুন, এবং বিভিন্ন শর্তাদির কোনও সেট সংজ্ঞা নেই, কাজেই কাজের বিবরণীর সাথে শর্তাবলীর সাথে মিল নেওয়ার পক্ষে সাধারণত কোনও সম্মত হয় না। এটি 'ওয়েব বিকাশকারী' বা 'ব্যাক-এন্ড বিকাশকারী' এর সাথে তুলনা করুন। এটি দুটি অনুরূপ কাজ যা যুক্তিসঙ্গতভাবে ভাল সম্মত হয়েছে এবং স্বতন্ত্র বর্ণন।
দ্বিতীয়ত, অনেক লোক চাকরির পোস্টিং এবং প্রাথমিক সাক্ষাত্কার দিচ্ছেন তারা জানেন না যে তারা কীসের জন্য নিযুক্ত হন। ছোট থেকে মাঝারি আকারের-সংস্থাগুলির ক্ষেত্রে এটি বিশেষভাবে সত্য যা তাদের জন্য আবেদনকারীদের সন্ধানের জন্য নিয়োগকারীদের নিয়োগ দেয়। এই মধ্যস্থতাকারীরা কেরিয়ারবিল্ডার বা যে কোনও ফোরামে কাজের বিবরণ পোস্ট করছে। এটি বলার অপেক্ষা রাখে না যে তাদের মধ্যে অনেকে তাদের স্টাফ জানেন না, তাদের বেশিরভাগ তাদের প্রতিনিধিত্ব করা সংস্থাগুলি এবং কর্মক্ষেত্রের প্রয়োজনীয়তা সম্পর্কে যথেষ্ট জ্ঞাত। তবে, বিভিন্ন নির্দিষ্ট কাজের বিবরণ দেওয়ার জন্য কোনও সংজ্ঞায়িত শর্ত ছাড়াই নীবুলাস কাজের শিরোনাম প্রায়শই ফলাফল হয়।
মাঠের তিনটি সাধারণ বিভাগ রয়েছে
আমার অভিজ্ঞতায় ডেটা সায়েন্সের 'জব স্পেস'-এর তিনটি সাধারণ বিভাগ রয়েছে।
প্রথমটি হ'ল গাণিতিক এবং গণনার কৌশলগুলির বিকাশ যা ডেটা বিজ্ঞানকে সম্ভব করে তোলে। এটি নতুন মেশিন লার্নিং পদ্ধতির পরিসংখ্যান গবেষণা, এই পদ্ধতিগুলির বাস্তবায়ন এবং বাস্তব বিশ্বে এই পদ্ধতিগুলিকে নিয়োগের জন্য গণ্য অবকাঠামো তৈরির মতো বিষয়গুলি অন্তর্ভুক্ত করে। এটি গ্রাহক থেকে সবচেয়ে দূরে বিভাজন এবং সবচেয়ে ছোট বিভাগ। এই কাজের বেশিরভাগ বড় বড় সংস্থাগুলির (গুগল, ফেসবুক, ইত্যাদি) শিক্ষাবিদ বা গবেষকরা করেছেন। এটি গুগলের টেনসরফ্লো, আইবিএম এর এসপিএসএস নিউরাল নেট বা পরবর্তী বড় গ্রাফ ডাটাবেস যা যা ঘটছে তা বিকাশের মতো জিনিসের জন্য।
দ্বিতীয় বিভাগটি অ্যাপ্লিকেশন নির্দিষ্ট প্যাকেজ তৈরি করতে অন্তর্নিহিত সরঞ্জামগুলি ব্যবহার করছে যা যা বিশ্লেষণের প্রয়োজন তা সম্পাদন করতে। লোকে পাইথন বা আর বা কিছু ব্যবহারের জন্য বিশ্লেষণের ক্ষমতা তৈরি করতে নিয়োগ করা হয় some এই অভিজ্ঞতা অনেকটা, আমার অভিজ্ঞতার সাথে, 'ডেটা লন্ড্রি' করা জড়িত, যে কোনও রূপেই কাঁচা ডেটা ব্যবহারের যোগ্য। এই কাজের আরেকটি বড় অংশ হ'ল ডেটাব্যাসিং; কীভাবে ডেটা সংরক্ষণ করতে হবে তা নির্ধারণ করে যা আপনার প্রয়োজনীয় টাইমলাইনে এটি অ্যাক্সেস করা যেতে পারে This
তৃতীয় বিভাগটি নতুন সংগঠিত এবং অ্যাক্সেসযোগ্য ডেটা থেকে বিশ্লেষণ তৈরি করছে। এটি আপনার প্রতিষ্ঠানের উপর নির্ভর করে সবচেয়ে বেশি গ্রাহকের মুখোমুখি। আপনাকে এমন বিশ্লেষণ তৈরি করতে হবে যা ব্যবসায়ী নেতারা সিদ্ধান্ত নিতে ব্যবহার করতে পারেন। এটি তিনটি বিভাগের মধ্যে ন্যূনতম প্রযুক্তিগত হবে; অনেক কাজ এই মুহূর্তে দ্বিতীয় এবং তৃতীয় বিভাগের মধ্যে সংকর হয়, যেহেতু তথ্য বিজ্ঞান শৈশবকালীন। তবে ভবিষ্যতে, আমি দৃ strongly়ভাবে সন্দেহ করি যে এই দুটি কাজের মধ্যে আরও পরিষ্কার বিভাজন হবে, লোকেরা দ্বিতীয় চাকরির সাথে একটি প্রযুক্তিগত, কম্পিউটার বিজ্ঞান বা পরিসংখ্যান ভিত্তিক শিক্ষার প্রয়োজন পড়বে এবং এই তৃতীয় কাজের জন্য কেবল একটি সাধারণ শিক্ষার প্রয়োজন হবে।
সাধারণভাবে, তিনটিই নিজেকে 'তথ্য বিজ্ঞানী' হিসাবে বর্ণনা করতে পারে তবে কেবল প্রথম দু'জনই যুক্তিযুক্তভাবে নিজেকে 'মেশিন লার্নিং ইঞ্জিনিয়ার' হিসাবে বর্ণনা করতে পারে।
উপসংহার
আপাতত, আপনাকে প্রতিটি চাকরীতে কী যুক্ত রয়েছে তা নিজেকে খুঁজে বের করতে হবে। আমার বর্তমান কাজটি আমাকে কিছু বিশ্লেষক হিসাবে নিয়োগ করেছে, কিছু মেশিন লার্নিংয়ের কাজ করার জন্য। কিন্তু আমরা কাজ করতে গিয়ে, স্পষ্ট হয়ে উঠল যে সংস্থার ডেটাবেজিং অপর্যাপ্ত ছিল এবং এখন আমার 90% সময় ডাটাবেসগুলিতে কাজ করতে ব্যয় হয়েছে। আমার মেশিন লার্নিং এক্সপোজারটি এখন কেবল সাইকিট-লার্ন প্যাকেজটিকে সবচেয়ে উপযুক্ত বলে মনে হচ্ছে, এবং গ্রাহকের জন্য পাওয়ারপয়েন্ট উপস্থাপনা করার জন্য তৃতীয় বিভাগের বিশ্লেষকদের কাছে সিএসভি ফাইলের শুটিং করছে।
ক্ষেত্রটি প্রবাহিত হয়। অনেকগুলি সংস্থা তাদের প্রক্রিয়াগুলিতে ডেটা বিজ্ঞানের সিদ্ধান্ত গ্রহণের চেষ্টা করছে, তবে এর অর্থ কী তা পরিষ্কার করে না জেনে। এটি তাদের দোষ নয়, ভবিষ্যতের ভবিষ্যদ্বাণী করা বেশ কঠিন এবং একটি নতুন প্রযুক্তির বিষয়টি কখনই খুব স্পষ্ট হয় না। ক্ষেত্রটি আরও প্রতিষ্ঠিত না হওয়া পর্যন্ত অনেকগুলি কাজ তাদের বর্ণনার জন্য ব্যবহৃত পদগুলির মতোই নেবুলাস থাকবে।
Data scientist
প্রকৃত কাজটি কী হবে সে সম্পর্কে স্বচ্ছতার সাথে একটি পদবি দেওয়ার মতো শোনায়, যখনmachine learning engineer
আরও সুনির্দিষ্ট। প্রথম ক্ষেত্রে, আপনার সংস্থা আপনাকে একটি লক্ষ্য দেবে এবং আপনি কী পদ্ধতির (মেশিন লার্নিং, ইমেজ প্রসেসিং, নিউরাল নেটওয়ার্ক, ফিজি লজিক ইত্যাদি) ব্যবহার করবেন তা খুঁজে বের করতে হবে। দ্বিতীয় ক্ষেত্রে, আপনার সংস্থাটি ইতিমধ্যে কী পদ্ধতির ব্যবহার করতে হবে তা সংকুচিত করে ফেলেছে।