ডেটা বিজ্ঞানী বনাম মেশিন লার্নিং ইঞ্জিনিয়ার


66

"ডেটা সায়েন্টিস্ট" এবং "মেশিন লার্নিং ইঞ্জিনিয়ার" এর মধ্যে পার্থক্যগুলি কী কী?

গত এক বছর ধরে বা "মেশিন লার্নিং ইঞ্জিনিয়ার" জব পোস্টিংগুলিতে প্রচুর দেখাতে শুরু করেছে। এটি সান ফ্রান্সিসকোতে বিশেষভাবে লক্ষণীয়, এটি যুক্তিযুক্ত যেখানে "তথ্য বিজ্ঞানী" শব্দটির উদ্ভব হয়েছিল। এক পর্যায়ে "ডেটা সায়েন্টিস্ট" "স্ট্যাটিস্টিশিয়ান" কে ছাপিয়ে গেলেন এবং আমি ভাবছিলাম যে এটি কি এখন ধীরে ধীরে "ডেটা সায়েন্টিস্ট" এর সাথে ঘটতে শুরু করেছে?

কর্মজীবনের পরামর্শটি এই সাইটে অফ-টপিক হিসাবে তালিকাভুক্ত করা হয়েছে, তবে আমি সংজ্ঞা সম্পর্কে জিজ্ঞাসা করায় আমার প্রশ্নটি অত্যন্ত প্রাসঙ্গিক হিসাবে দেখি; আমি আমার নিজের কেরিয়ারের ট্র্যাজেক্টোরি বা ব্যক্তিগত পরিস্থিতি যেমন অন্যান্য অফ-টক প্রশ্নগুলির মত ব্যক্তিগত পরিস্থিতিতে দেওয়া প্রস্তাবগুলি সম্পর্কে জিজ্ঞাসা করছি না।

এই প্রশ্নটি বিষয়ভিত্তিক কারণ এটির কোনও দিন এই সাইটের অনেক ব্যবহারকারীর জন্য উল্লেখযোগ্য প্রভাব থাকতে পারে lic আসলে, এই স্ট্যাক-এক্সচেঞ্জের সাইটটি যদি উপস্থিত না থাকত তবে "পরিসংখ্যানবিদ" বনাম "ডেটা সায়েন্টিস্ট" বিবর্তন না ঘটে থাকতে পারে। সেই দিক থেকে এটি একটি বরং প্রাসঙ্গিক, সম্ভাব্য অস্তিত্বের প্রশ্ন।


2
Data scientistপ্রকৃত কাজটি কী হবে সে সম্পর্কে স্বচ্ছতার সাথে একটি পদবি দেওয়ার মতো শোনায়, যখন machine learning engineerআরও সুনির্দিষ্ট। প্রথম ক্ষেত্রে, আপনার সংস্থা আপনাকে একটি লক্ষ্য দেবে এবং আপনি কী পদ্ধতির (মেশিন লার্নিং, ইমেজ প্রসেসিং, নিউরাল নেটওয়ার্ক, ফিজি লজিক ইত্যাদি) ব্যবহার করবেন তা খুঁজে বের করতে হবে। দ্বিতীয় ক্ষেত্রে, আপনার সংস্থাটি ইতিমধ্যে কী পদ্ধতির ব্যবহার করতে হবে তা সংকুচিত করে ফেলেছে।
gurvinder372

সম্পর্কিত: তথ্য বিজ্ঞান বনাম অপারেশন গবেষণা । এছাড়াও একজন বিজ্ঞানী ইঞ্জিনিয়ারের চেয়ে আলাদা কিছু । দুর্ভাগ্যক্রমে, শিল্প এ সম্পর্কে যত্ন নিয়েছে বলে মনে হচ্ছে না।
টিকটিকি

1
অন্য কেউ যেমন উল্লেখ করেছেন, একজন এমএল ইঞ্জিনিয়ার হ'ল এমন ব্যক্তি যিনি এমএল মডেলগুলিকে উত্পাদনে রাখেন। প্রকৃত ভবিষ্যদ্বাণীমূলক মডেলগুলি এবং তাদের অন্তর্নিহিত গণিতটি গভীরভাবে বুঝতে আশা করা যায় না, তাদের এই সফ্টওয়্যার সরঞ্জামগুলির দক্ষতা অর্জন করতে হবে যা এই মডেলগুলি ব্যবহারযোগ্য করে তোলে। একজন ডেটা সায়েন্টিস্টের কাছে পরিসংখ্যান / গণিত এবং এমএল / এআই সম্পর্কে গভীর ধারণা থাকতে পারে এবং এমএল ইঞ্জিনিয়ারদের দ্বারা ব্যবহৃত সরঞ্জামগুলি তৈরি করেন এমন ব্যক্তি প্রায়ই হন। সুতরাং একজন এমএল ইঞ্জিনিয়ার মূলত একটি বিশেষায়িত সফ্টওয়্যার ইঞ্জিনিয়ারের কাছাকাছি এবং একটি ডিএস একটি গণ্য পরিসংখ্যানবিদের কাছাকাছি।
ডিজিও

উত্তর:


55

ভাল প্রশ্ন. আসলে এই বিষয় নিয়ে অনেক বিভ্রান্তি রয়েছে, মূলত কারণ দু'জনেই বেশ নতুন নতুন কাজ। তবে যদি আমরা শব্দার্থবিজ্ঞানের দিকে মনোনিবেশ করি তবে চাকরীর আসল অর্থ স্পষ্ট হয়ে যায়।

একক বিষয়, ডেটা নিয়ে কথা বলার আগে আপেলের সাথে আপেলের তুলনা করা আরও ভাল। মেশিন লার্নিং এবং এর উপ-জেনার (ডিপ লার্নিং ইত্যাদি) পরিসংখ্যানতত্ত্ব, ডেটা অর্জন (ডিএকিউ), প্রসেসিং (যা নন-মেশিন লার্নিং চালিত হতে পারে) এর সাথে ডেটা ওয়ার্ল্ডের কেবল একটি দিক the ফলাফল ব্যাখ্যা, ইত্যাদি

সুতরাং, আমার ব্যাখ্যার জন্য, আমি মেশিন লার্নিং ইঞ্জিনিয়ার ভূমিকাটি ডেটা ইঞ্জিনিয়ারের একজনকে প্রসারিত করব।

বিজ্ঞান পরীক্ষা, পরীক্ষা এবং ব্যর্থতা, তত্ত্বের বিল্ডিং, ঘটনাগত বোঝাপড়া সম্পর্কে। ইঞ্জিনিয়ারিং বিজ্ঞান ইতিমধ্যে যা জানে তার সম্পর্কে কাজ করে, এটিকে নিখুঁত করে তোলে এবং "বাস্তব জগতে" নিয়ে যায়।

একটি প্রক্সি সম্পর্কে চিন্তা করুন: পারমাণবিক বিজ্ঞানী এবং পারমাণবিক ইঞ্জিনিয়ারের মধ্যে পার্থক্য কী?

পারমাণবিক বিজ্ঞানী হলেন একজন যাঁরা পরমাণুর পিছনে বিজ্ঞান জানেন, তাদের মধ্যে মিথস্ক্রিয়া, তিনিই এমন একটি রেসিপি লিখেছিলেন যা পরমাণু থেকে শক্তি পাওয়ার অনুমতি দেয়।

নিউক্লিয়ার ইঞ্জিনিয়ার হলেন সেই লোক, যাকে বিজ্ঞানীর রেসিপিটি নেওয়ার জন্য এবং আসল বিশ্বে নিয়ে যাওয়ার জন্য অভিযুক্ত করা হয়। সুতরাং এটি পারমাণবিক পদার্থবিজ্ঞান সম্পর্কে জ্ঞান যথেষ্ট সীমাবদ্ধ তবে তিনি উপকরণ, বিল্ডিং, অর্থনীতি এবং সঠিক পারমাণবিক প্লান্ট তৈরিতে দরকারী অন্য যে কোনও বিষয় সম্পর্কেও জানেন।

ডেটা জগতে ফিরে আসছি, এখানে আরও একটি উদাহরণ রয়েছে: কনভলিউশনাল নিউরাল নেটওয়ার্কগুলি (ইয়ান লেকুন) যে লোকেরা বিকাশ করেছিল সে হলেন একজন ডেটা সায়েন্টিস্ট, যে লোকটি ছবিতে মুখগুলি সনাক্ত করতে মডেলটি স্থাপন করে তা হ'ল একজন মেশিন লার্নিং ইঞ্জিনিয়ার। ডেটা অধিগ্রহণ থেকে। জেপিজি চিত্র নিবন্ধকরণ পর্যন্ত পুরো প্রক্রিয়াটির জন্য দায়ী ব্যক্তি একজন ডেটা ইঞ্জিনিয়ার।

সুতরাং, মূলত, বর্তমানে ডেটা সায়েন্টিস্টের 90% হলেন আসলে ডেটা ইঞ্জিনিয়ার বা মেশিন লার্নিং ইঞ্জিনিয়ার্স এবং ডেটা সায়েন্টিস্ট হিসাবে খোলা পজিশনের 90% আসলে প্রকৌশলী প্রয়োজন need একটি সহজ চেক: সাক্ষাত্কারে, আপনি কতগুলি এমএল মডেল প্রযোজনায় নিযুক্ত করেছিলেন সে সম্পর্কে আপনাকে জিজ্ঞাসা করা হবে, আপনি নতুন পদ্ধতিতে প্রকাশিত কতগুলি কাগজপত্রের বিষয়ে নয়।

পরিবর্তে, আপনি যখন "মেশিন লার্নিং ইঞ্জিনিয়ার" সম্পর্কে ঘোষণা দেখেন, তার অর্থ হ'ল নিয়োগকারীরা পার্থক্য সম্পর্কে ভাল জানেন এবং তাদের সত্যিকারের এমন একজনের প্রয়োজন হয় যাতে উত্পাদন করতে কিছু মডেল রাখতে সক্ষম হন।


আমি কখনও পারমাণবিক বিজ্ঞানী বনাম ইঞ্জিনিয়ারের কথা ভাবি নি, আমার মনে হয় এটি একটি সঠিক উত্তর। এটি আমার অভিজ্ঞতার পক্ষে উপযুক্ত, যখন আমি বিশ্লেষণ করি তখন এটি হোয়াইট ল্যাব কোটের মতো (জিউটার এবং সুন্দর গ্রাফ)। যখন আমি ইঞ্জিনিয়ারিং প্রোডাক্ট ওয়ার্কের সাথে "আমার হাত নোংরা করছি" তখন আমি নিয়মিত অদ্ভুত প্রান্তের মামলাগুলি, বাগগুলি এবং খারাপ কোডের গন্ধ খুঁজে পাচ্ছি।
টনি

ইয়ান লেকুন কি কম্পিউটার বিজ্ঞানী নন? এবং ডেটা সায়েন্টিস্ট এমন কেউ হবেন যে ডেটাটির বৈজ্ঞানিক বিশ্লেষণ করতে প্রাক-তৈরি কম্পিউটার অ্যালগরিদম এবং কৌশলগুলি (ইয়ান লেকুনের মতো কম্পিউটার বিজ্ঞানী দ্বারা উদ্ভাবিত) ব্যবহার করেন? অন্য বিজ্ঞানীরাও তাদের কাজকর্মের সাথে একইভাবে কম্পিউটার ব্যবহার করেন? সুতরাং ডেটা অর্জন করা, এটি পরিষ্কার করা, বিভিন্ন বিশ্লেষণ কৌশল (প্লটিং, প্যাটার্ন ম্যাচিং, এমএল মডেল ইত্যাদি) একত্রিত করে তথ্যের মধ্যে লুকানো সত্যগুলি জানতে?
দিদিয়ার এ

ওয়াইএলসি, প্রকৃতপক্ষে একজন কম্পিউটার বিজ্ঞানী, তবে তিনি ডেটাতে বিশেষজ্ঞ specialized সিএস একটি বিস্তৃত ক্ষেত্র হয়ে উঠেছে, সেখান থেকে সমস্ত নতুন সংজ্ঞা (ডিএসের মতো) বেরিয়ে এসেছিল। এবং তাই সিএস ব্যবহার করা আসলেই বৈষম্যমূলক হয়ে ওঠে না। কয়েক শত বছর পূর্বে অ্যাপিলেটিক "পদার্থবিজ্ঞানী" এর মতো: আজ এই শব্দটি কারও কাজকে প্রকৃতপক্ষে সংজ্ঞায়িত করে না, যদি না আপনি এটিকে আরও ভালভাবে নির্দিষ্ট করে থাকেন (উদাঃ পার্টিকেল পি, সলিড স্টেট পি, ইত্যাদি)। তবে যাইহোক, একজন বিজ্ঞানী (সিএস, ডিএস, যে কোনও এস) নিজেকে অন্যের আবিষ্কারগুলিতে সীমাবদ্ধ রাখেন না। পরিবর্তে, তার কাজটি বোঝা এবং এর মাধ্যমে আবিষ্কার করা।
ভিনসেঞ্জো লোভারিনি

ক্যারিয়ারের দিকনির্দেশনা সম্পর্কে আপনি কি দয়া করে এই প্রশ্নের উত্তর দিতে পারেন Data Engineer
stom

"ঘটনাবলী বোঝার" সম্পর্কে বিজ্ঞান কীভাবে?
উবাদাব

10

পদগুলি নবীন কারণ এগুলি নতুন

'ডেটা সায়েন্স' ক্ষেত্রে চাকরীর সন্ধানের মাঝামাঝি হওয়ার কারণে, আমি মনে করি যে এখানে দুটি জিনিস চলছে। প্রথমত, চাকরিগুলি নতুন, এবং বিভিন্ন শর্তাদির কোনও সেট সংজ্ঞা নেই, কাজেই কাজের বিবরণীর সাথে শর্তাবলীর সাথে মিল নেওয়ার পক্ষে সাধারণত কোনও সম্মত হয় না। এটি 'ওয়েব বিকাশকারী' বা 'ব্যাক-এন্ড বিকাশকারী' এর সাথে তুলনা করুন। এটি দুটি অনুরূপ কাজ যা যুক্তিসঙ্গতভাবে ভাল সম্মত হয়েছে এবং স্বতন্ত্র বর্ণন।

দ্বিতীয়ত, অনেক লোক চাকরির পোস্টিং এবং প্রাথমিক সাক্ষাত্কার দিচ্ছেন তারা জানেন না যে তারা কীসের জন্য নিযুক্ত হন। ছোট থেকে মাঝারি আকারের-সংস্থাগুলির ক্ষেত্রে এটি বিশেষভাবে সত্য যা তাদের জন্য আবেদনকারীদের সন্ধানের জন্য নিয়োগকারীদের নিয়োগ দেয়। এই মধ্যস্থতাকারীরা কেরিয়ারবিল্ডার বা যে কোনও ফোরামে কাজের বিবরণ পোস্ট করছে। এটি বলার অপেক্ষা রাখে না যে তাদের মধ্যে অনেকে তাদের স্টাফ জানেন না, তাদের বেশিরভাগ তাদের প্রতিনিধিত্ব করা সংস্থাগুলি এবং কর্মক্ষেত্রের প্রয়োজনীয়তা সম্পর্কে যথেষ্ট জ্ঞাত। তবে, বিভিন্ন নির্দিষ্ট কাজের বিবরণ দেওয়ার জন্য কোনও সংজ্ঞায়িত শর্ত ছাড়াই নীবুলাস কাজের শিরোনাম প্রায়শই ফলাফল হয়।

মাঠের তিনটি সাধারণ বিভাগ রয়েছে

আমার অভিজ্ঞতায় ডেটা সায়েন্সের 'জব স্পেস'-এর তিনটি সাধারণ বিভাগ রয়েছে।

প্রথমটি হ'ল গাণিতিক এবং গণনার কৌশলগুলির বিকাশ যা ডেটা বিজ্ঞানকে সম্ভব করে তোলে। এটি নতুন মেশিন লার্নিং পদ্ধতির পরিসংখ্যান গবেষণা, এই পদ্ধতিগুলির বাস্তবায়ন এবং বাস্তব বিশ্বে এই পদ্ধতিগুলিকে নিয়োগের জন্য গণ্য অবকাঠামো তৈরির মতো বিষয়গুলি অন্তর্ভুক্ত করে। এটি গ্রাহক থেকে সবচেয়ে দূরে বিভাজন এবং সবচেয়ে ছোট বিভাগ। এই কাজের বেশিরভাগ বড় বড় সংস্থাগুলির (গুগল, ফেসবুক, ইত্যাদি) শিক্ষাবিদ বা গবেষকরা করেছেন। এটি গুগলের টেনসরফ্লো, আইবিএম এর এসপিএসএস নিউরাল নেট বা পরবর্তী বড় গ্রাফ ডাটাবেস যা যা ঘটছে তা বিকাশের মতো জিনিসের জন্য।

দ্বিতীয় বিভাগটি অ্যাপ্লিকেশন নির্দিষ্ট প্যাকেজ তৈরি করতে অন্তর্নিহিত সরঞ্জামগুলি ব্যবহার করছে যা যা বিশ্লেষণের প্রয়োজন তা সম্পাদন করতে। লোকে পাইথন বা আর বা কিছু ব্যবহারের জন্য বিশ্লেষণের ক্ষমতা তৈরি করতে নিয়োগ করা হয় some এই অভিজ্ঞতা অনেকটা, আমার অভিজ্ঞতার সাথে, 'ডেটা লন্ড্রি' করা জড়িত, যে কোনও রূপেই কাঁচা ডেটা ব্যবহারের যোগ্য। এই কাজের আরেকটি বড় অংশ হ'ল ডেটাব্যাসিং; কীভাবে ডেটা সংরক্ষণ করতে হবে তা নির্ধারণ করে যা আপনার প্রয়োজনীয় টাইমলাইনে এটি অ্যাক্সেস করা যেতে পারে This

তৃতীয় বিভাগটি নতুন সংগঠিত এবং অ্যাক্সেসযোগ্য ডেটা থেকে বিশ্লেষণ তৈরি করছে। এটি আপনার প্রতিষ্ঠানের উপর নির্ভর করে সবচেয়ে বেশি গ্রাহকের মুখোমুখি। আপনাকে এমন বিশ্লেষণ তৈরি করতে হবে যা ব্যবসায়ী নেতারা সিদ্ধান্ত নিতে ব্যবহার করতে পারেন। এটি তিনটি বিভাগের মধ্যে ন্যূনতম প্রযুক্তিগত হবে; অনেক কাজ এই মুহূর্তে দ্বিতীয় এবং তৃতীয় বিভাগের মধ্যে সংকর হয়, যেহেতু তথ্য বিজ্ঞান শৈশবকালীন। তবে ভবিষ্যতে, আমি দৃ strongly়ভাবে সন্দেহ করি যে এই দুটি কাজের মধ্যে আরও পরিষ্কার বিভাজন হবে, লোকেরা দ্বিতীয় চাকরির সাথে একটি প্রযুক্তিগত, কম্পিউটার বিজ্ঞান বা পরিসংখ্যান ভিত্তিক শিক্ষার প্রয়োজন পড়বে এবং এই তৃতীয় কাজের জন্য কেবল একটি সাধারণ শিক্ষার প্রয়োজন হবে।

সাধারণভাবে, তিনটিই নিজেকে 'তথ্য বিজ্ঞানী' হিসাবে বর্ণনা করতে পারে তবে কেবল প্রথম দু'জনই যুক্তিযুক্তভাবে নিজেকে 'মেশিন লার্নিং ইঞ্জিনিয়ার' হিসাবে বর্ণনা করতে পারে।

উপসংহার

আপাতত, আপনাকে প্রতিটি চাকরীতে কী যুক্ত রয়েছে তা নিজেকে খুঁজে বের করতে হবে। আমার বর্তমান কাজটি আমাকে কিছু বিশ্লেষক হিসাবে নিয়োগ করেছে, কিছু মেশিন লার্নিংয়ের কাজ করার জন্য। কিন্তু আমরা কাজ করতে গিয়ে, স্পষ্ট হয়ে উঠল যে সংস্থার ডেটাবেজিং অপর্যাপ্ত ছিল এবং এখন আমার 90% সময় ডাটাবেসগুলিতে কাজ করতে ব্যয় হয়েছে। আমার মেশিন লার্নিং এক্সপোজারটি এখন কেবল সাইকিট-লার্ন প্যাকেজটিকে সবচেয়ে উপযুক্ত বলে মনে হচ্ছে, এবং গ্রাহকের জন্য পাওয়ারপয়েন্ট উপস্থাপনা করার জন্য তৃতীয় বিভাগের বিশ্লেষকদের কাছে সিএসভি ফাইলের শুটিং করছে।

ক্ষেত্রটি প্রবাহিত হয়। অনেকগুলি সংস্থা তাদের প্রক্রিয়াগুলিতে ডেটা বিজ্ঞানের সিদ্ধান্ত গ্রহণের চেষ্টা করছে, তবে এর অর্থ কী তা পরিষ্কার করে না জেনে। এটি তাদের দোষ নয়, ভবিষ্যতের ভবিষ্যদ্বাণী করা বেশ কঠিন এবং একটি নতুন প্রযুক্তির বিষয়টি কখনই খুব স্পষ্ট হয় না। ক্ষেত্রটি আরও প্রতিষ্ঠিত না হওয়া পর্যন্ত অনেকগুলি কাজ তাদের বর্ণনার জন্য ব্যবহৃত পদগুলির মতোই নেবুলাস থাকবে।


9

[সম্পূর্ণ ব্যক্তিগত মতামত]

যখন ডেটা সায়েন্টিস্ট শব্দটি 'স্ট্যাটিস্টিস্টিয়ান' কে ছাড়িয়ে গেছে, তখন এটি কোনও বড় পার্থক্যের চেয়ে শীতল শোনার দিকে বেশি more একইভাবে, 'ডিপ লার্নিং' শব্দটি। এটি বেশ কয়েকটি স্তর সহ কেবল নিউরাল নেটওয়ার্ক (যা অন্য একটি মেশিন লার্নিং অ্যালগরিদম)। যখন কোনও নির্দিষ্ট নিউরাল নেটকে এমএল না করে ডিএল বলা যায় তখন কেউ ব্যাখ্যা করতে পারে না, কারণ সংজ্ঞাটি নিজেই অস্পষ্ট। সুতরাং, শব্দটি ডেটা সায়েন্টিস্ট।

তবে, সংস্থাগুলি ডেটা সায়েন্সে ডিভোপস মানসিকতা গ্রহণ করার ফলে, এমএল ইঞ্জিনিয়ার শব্দটি বিকশিত হয়েছিল।

ডেটা বিজ্ঞানের ডেভোপস মানসিকতা কী?

আপনি এখানে মডেলটি তৈরি করেন, এটি স্থাপন করুন এবং এটি উত্পাদনে বজায় রাখবেন বলেও আশা করেছিলেন। এটি সফ্টওয়্যার দলগুলিতে প্রচুর ঘর্ষণ এড়াতে সহায়তা করে।

[পিএস: ডিওঅপস হ'ল সফটওয়্যার করার একটি উপায়, আরও দর্শনের মতো। সুতরাং, এটি একটি পদবি হিসাবে ব্যবহার করে আবার আমাকে বিভ্রান্ত করে]।

সুতরাং, এমএল ইঞ্জিনিয়ারদের সিস্টেম ইঞ্জিনিয়ারিং, এমএল এবং পরিসংখ্যানগুলির স্পষ্টতাই (স্পষ্টতই) জানা থাকার কথা।

একটি অস্পষ্ট সাধারণীকরণ হবেন ডেটা ইঞ্জিনিয়ার + ডেটা সায়েন্টিস্ট = এমএল ইঞ্জিনিয়ার।

এই কথাটি বলার পরে, এই জায়গার পদবি দিন দিন অস্পষ্ট হয়ে উঠছে এবং 'পরিসংখ্যানবিদ' শব্দটি আরও বেশি প্রাসঙ্গিক হয়ে উঠছে (বিড়ম্বনা!)।


2
মেশিন লার্নিং কেবল নিউরাল নেট (যেমন একটি উদাহরণ হিসাবে সমস্ত ধরণের গাছ ভিত্তিক শ্রেণিবদ্ধকারী বিবেচনা করুন) এর চেয়ে অনেক বেশি, সুতরাং কীভাবে "ডিপ লার্নিং কেবল আরও কয়েকটি স্তর সহ কেবল মেশিন লার্নিং" তা দেখবেন না।
এস কোলাসা - মনিকা

@ স্টেফানকোলাসা হ্যাঁ একমত। এটি খুব বেশি সাধারণীকরণ করা উচিত নয় :) এটি নির্দেশ করার জন্য ধন্যবাদ ting
দাওয়ানি 33

1
(+1) তবে আমি মনে করি না যে "পরিসংখ্যানবিদ" আরও প্রাসঙ্গিক হয়ে ওঠা একটি বিড়ম্বনা, ঠিক ... একটি প্রত্যাশিত রূপান্তর? আজকাল "অপারেশনাল গবেষক" কোথায়? ;)
usεr11852

7

এটি একেক কোম্পানিতে পরিবর্তিত হতে পারে তবে উপাধি হিসাবে ডেটা সায়েন্টিস্ট এখন কিছু সময়ের জন্য রয়েছে এবং এটি সাধারণত ডেটা থেকে জ্ঞান এবং অন্তর্দৃষ্টি আহরণের জন্য বোঝানো হয়

আমি তথ্য বিজ্ঞানীরা করতে দেখেছি

  • চিত্র প্রক্রিয়াকরণ এবং চিত্র স্বীকৃতি আলগোরিদিম রচনা,
  • ব্যবসায়িক ব্যবহারের ক্ষেত্রে সিদ্ধান্ত গাছগুলি ডিজাইন এবং প্রয়োগ করুন,
  • অথবা সহজেই কিছু প্রতিবেদন ডিজাইন করুন এবং প্রয়োগ করুন বা ডেটা ট্রান্সফরমেশনের জন্য ইটিএল লিখুন।

ডেটা সায়েন্স , তবে মেশিন লার্নিংয়ের একটি সুপার-ডোমেন

এটি গণিত, পরিসংখ্যান, তথ্য বিজ্ঞান এবং কম্পিউটার বিজ্ঞানের বিস্তৃত ক্ষেত্রগুলির মধ্যে বিশেষত মেশিন লার্নিং, শ্রেণিবিন্যাস, গুচ্ছ বিশ্লেষণ, অনিশ্চয়তা পরিমান, গণনা বিজ্ঞান, ডেটা মাইনিং, ডাটাবেস, এর বিস্তৃত ক্ষেত্রগুলির মধ্যে বিভিন্ন ক্ষেত্র থেকে আঁকা কৌশল এবং তত্ত্বগুলি নিয়োগ করে, এবং ভিজ্যুয়ালাইজেশন

মেশিন লার্নিং ইঞ্জিনিয়ার এমন একটি পদবি বলে মনে হচ্ছে যেখানে আপনার নিয়োগকর্তা ইতিমধ্যে সংকীর্ণ হয়ে গেছেন

  • পদ্ধতি,
  • সরঞ্জাম,
  • এবং একটি মোটামুটি মডেল (কী সরবরাহ করতে হবে)

মেশিন লার্নিং ব্যবহার করে ডেটা থেকে জ্ঞান বা অন্তর্দৃষ্টি আহরণ করা এবং আপনার কাজটি সরবরাহ করার জন্য মেশিন লার্নিং অ্যালগরিদমগুলি ডিজাইন এবং প্রয়োগ করা হবে


5

মেশিন লার্নিং ইঞ্জিনিয়ার্স এবং ইঞ্জিনিয়ারিং ফোকাসযুক্ত ডেটা সায়েন্টিস্ট একই, তবে সমস্ত ডেটা সায়েন্টিস্ট ইঞ্জিনিয়ারিং ফোকাসযুক্ত নয়। প্রায় 5 বছর আগে প্রায় সমস্ত ডেটা সায়েন্টিস্ট ইঞ্জিনিয়ারিং ফোকাসে ছিলেন, যেমন, তাদের প্রোডাকশন কোডটি লিখতে হয়েছিল। তবে এখন, অনেকগুলি ডেটা সায়েন্টিস্ট ভূমিকা রয়েছে যা বেশিরভাগ অংশের জন্য: জুপিটার নোটবুকে খেলা, ডেটা বোঝা, চমত্কার গ্রাফ তৈরি করা, ক্লায়েন্ট, ম্যানেজার, বিশ্লেষকদের বোঝানো ... তারা কোনও ইঞ্জিনিয়ারিং করে না। এবং আমি বিশ্বাস করি যে মেশিন লার্নিং ইঞ্জিনিয়াররা এই ইঞ্জিনিয়ারিংয়ের অবস্থানটিকে নিম্নরেখায় নিয়ে এসেছেন।


2

টিএল; ডিআর: এটি কে জিজ্ঞাসা করছে তার উপর নির্ভর করে।

এই প্রশ্নের উত্তর বেশিরভাগ প্রত্যাশা, জ্ঞান এবং যাকে জিজ্ঞাসা করছে তার অভিজ্ঞতার উপর নির্ভর করে। একটি উত্তর হিসাবে অস্পষ্ট সঙ্গে একটি অভিন্ন প্রশ্ন:

একটি সফ্টওয়্যার বিকাশকারী, একটি সফটওয়্যার ইঞ্জিনিয়ার এবং কম্পিউটার বিজ্ঞানীর মধ্যে পার্থক্য কী?

কিছু লোকের জন্য, বিশেষত যারা কম্পিউটার বিজ্ঞান এবং সফ্টওয়্যার ইঞ্জিনিয়ারিং অধ্যয়ন করেন বা পড়ান তাদের ক্ষেত্রে এই ক্ষেত্রগুলির মধ্যে একটি বৃহত এবং সংজ্ঞায়িত পার্থক্য রয়েছে। তবে গড় এইচআর কর্মী, প্রযুক্তিগত নিয়োগকারী বা পরিচালক হিসাবে এগুলি কেবলমাত্র "কম্পিউটার পিপল"।

আমি ভিনসেন্ট গ্র্যানভিলের এই উক্তিটি ভালোবাসি , আমার উপর জোর দেওয়া:

আমার কেরিয়ারের শুরুর দিকে (প্রায় 1990) আমি স্যাটেলাইট চিত্রগুলিতে নিদর্শনগুলি (বা আকার বা বৈশিষ্ট্যগুলি উদাহরণস্বরূপ হ্রদ) সনাক্তকরণ এবং চিত্র বিভাজন সম্পাদন করার জন্য অন্যান্য বিষয়ের মধ্যেও ইমেজ রিমোট সেন্সিং প্রযুক্তিতে কাজ করেছি: তখন আমার গবেষণাকে গণনা হিসাবে চিহ্নিত করা হয়েছিল পরিসংখ্যান, কিন্তু আমার হোম ইউনিভার্সিটির পাশের কম্পিউটার বিজ্ঞান বিভাগে ঠিক একই জিনিসটি করা লোকেরা তাদের গবেষণাটিকে কৃত্রিম বুদ্ধিমত্তা বলে অভিহিত করে। আজ, এটি ডেটা সায়েন্স বা কৃত্রিম বুদ্ধিমত্তা বলা হবে , সাব-ডোমেনগুলি হচ্ছে সিগন্যাল প্রসেসিং, কম্পিউটার ভিশন বা আইওটি।


1

মেশিন লার্নিং আরও সুনির্দিষ্ট এবং ক্ষেত্রের ক্ষেত্রে আপনাকে নিম্নলিখিত বিষয়গুলির উপর দক্ষতা অর্জন করতে হবে:

  • বৈশিষ্ট্য বনাম লেবেল
  • পরীক্ষার ডেটা বনাম প্রশিক্ষণ ডেটা
  • বৈশিষ্ট্য নরমালাইজেশন
  • সাধারণ ডেটা স্ট্রাকচার (অ্যারের অ্যারে)
  • বৈশিষ্ট্য নির্বাচন

0

আমি দেওয়া উত্তরগুলির সাথে একমত নই। যাইহোক, আমি মনে করি যে এখানে ডেটা সায়েন্টিস্টের একটি ভূমিকা রয়েছে যা এখানে কার্যত সমস্ত উত্তরগুলিতে প্রকাশিত হচ্ছে। এই উত্তরগুলির বেশিরভাগই এর প্রভাবকে কিছু বলে, "ঠিক আছে, একজন ইঞ্জিনিয়ার কেবল মডেলটি লিখেছেন এবং মোতায়েন করেন।" এক সেকেন্ড ধরে থাকুন - আছে একটি অনেক ঐ দুটি ধাপে কাজ!

ডেটা সায়েন্টিস্টের আমার মূল সংজ্ঞাটি এমন কেউ আছেন যা তথ্য নিয়ে কাজ করার জন্য বৈজ্ঞানিক পদ্ধতি প্রয়োগ করে। সুতরাং আমি ক্রমাগত হাইপোথেসিজ, পরীক্ষা ডিজাইন করা, আমার ডেটা সংগ্রহ এবং সেই পরীক্ষাগুলি সম্পাদন, আমার ক্রস বৈধকরণের ফলাফলগুলি পরীক্ষা করা, নতুন পদ্ধতির চেষ্টা করা, আমার ডেটা রুপান্তরকরণ ইত্যাদির কথা ভাবছি That's এটাই মূলত যা কেবল "মডেলকে লিখে এবং স্থাপন করে "একটি পেশাদার সেটিং এ।

সুতরাং, আপনার উত্তরের জন্য, আমি মনে করি "শয়তান বিশদে রয়েছে" কারণ আপনি এই কয়েকটি পদক্ষেপ / শর্তাদি সম্পর্কে কেবল চকচকে করতে পারবেন না। এছাড়াও, আপনি যদি চাকরির শিকার হন তবে আপনার সাবধানতা অবলম্বন করা উচিত কারণ "ডেটা ইঞ্জিনিয়ার" এবং "ডেটা সায়েন্টিস্ট" এর জন্য বিভিন্ন ধরণের বেতন স্কেল হতে পারে - আপনি কোনও ডেটা ইঞ্জিনিয়ার বেতনে ডেটা বিজ্ঞানী হতে চান না!

আমি সর্বদা নিজেকে সেখানে ডেটা বিজ্ঞানী হিসাবে রেখেছি, আমি সংস্থাগুলিকে বলি যে আমি ভবিষ্যদ্বাণীপূর্ণ মডেলগুলিতে কাজ করি (কেবল বিশ্লেষণাত্মক নয়) এবং আমি এক্সেল জকি নই - আমি প্রোগ্রামিং ভাষায় (আর, পাইথন ইত্যাদি) লিখি। যদি আপনি এমন কোনও অবস্থান খুঁজে পেতে পারেন যা আসুন আপনি উভয়টিই করেন তবে আপনি ডেটা বিজ্ঞানী হওয়ার পথে রয়েছেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.