তথ্য বিজ্ঞানী কী?


181

পরিসংখ্যানগুলিতে সম্প্রতি আমার পিএইচডি প্রোগ্রাম থেকে স্নাতক হওয়ার পরে, আমি গত কয়েক মাস ধরে পরিসংখ্যানের ক্ষেত্রে কাজ সন্ধান করতে শুরু করেছিলাম। আমি বিবেচিত প্রায় প্রতিটি সংস্থা " ডেটা সায়েন্টিস্ট " এর একটি কাজের শিরোনাম সহ একটি চাকরী পোস্ট করে । প্রকৃতপক্ষে, মনে হয়েছিল স্ট্যাটিস্টিকাল সায়েন্টিস্ট বা স্ট্যাটিসটিক্যান্সের কাজের শিরোনাম দেখার দিনগুলি অনেক দিন কেটে গেল । একজন ডেটা বিজ্ঞানী হয়ে কি সত্যিই প্রতিস্থাপন করেছিলেন যা একটি পরিসংখ্যানবিদ হলেন বা শিরোনামের প্রতিশব্দ ছিল যা আমি ভাবছিলাম?

ঠিক আছে, চাকরীর ক্ষেত্রে বেশিরভাগ যোগ্যতা এমন বিষয়গুলির মতো অনুভূত হয়েছিল যা পরিসংখ্যানবিদদের শিরোনামে যোগ্যতা অর্জন করবে। বেশিরভাগ চাকরি পরিসংখ্যানগুলিতে পিএইচডি চেয়েছিল ( ), সর্বাধিক প্রয়োজনীয় বোঝাপড়া পরীক্ষামূলক নকশা ( ), লিনিয়ার রিগ্রেশন এবং আনোভা ( ), সাধারণীকরণীয় রৈখিক মডেল ( ), এবং অন্যান্য বহুবিধ পদ্ধতি যেমন পিসিএ ( ) , পাশাপাশি আর বা এসএএস ( ) এর মতো একটি পরিসংখ্যানগত কম্পিউটিং পরিবেশে জ্ঞান । ডেটা সায়েন্টিস্টের মতো মনে হয় স্ট্যাটিস্টিশিয়ানদের পক্ষে কেবল একটি কোডের নাম।

যাইহোক, প্রতিটি সাক্ষাত্কারে আমি এই প্রশ্নটি শুরু করেছিলাম: "সুতরাং আপনি কি মেশিন লার্নিং অ্যালগরিদমগুলির সাথে পরিচিত?" প্রায়শই না, আমি নিজেকে বড় ডেটা, উচ্চ পারফরম্যান্স কম্পিউটিং এবং নিউরাল নেটওয়ার্কগুলি সম্পর্কিত বিষয়গুলি, কার্ট, সমর্থন ভেক্টর মেশিন, গাছ বাড়ানো, নিরীক্ষণযোগ্য মডেল ইত্যাদির বিষয়ে প্রশ্নের উত্তর এবং উত্তর দিতে পেরেছি। নিশ্চিত আমি নিজেকে নিশ্চিত করেছিলাম যে এগুলি সবই ছিল হৃদয়ের পরিসংখ্যানগত প্রশ্নগুলি, তবে প্রতিটি সাক্ষাত্কারের শেষে আমি সাহায্য করতে পারিনি তবে এমন অনুভূতি ছেড়ে যাচ্ছিলাম যে ডেটা বিজ্ঞানী কী তা সম্পর্কে আমি কম-বেশি জানি।

আমি একজন পরিসংখ্যানবিদ, তবে আমি কি ডেটা বিজ্ঞানী? আমি বৈজ্ঞানিক সমস্যা নিয়ে কাজ করি তাই আমাকে অবশ্যই একজন বিজ্ঞানী হতে হবে! এবং আমি ডেটা নিয়েও কাজ করি, সুতরাং অবশ্যই আমাকে ডেটা বিজ্ঞানী হতে হবে! এবং উইকিপিডিয়া অনুসারে, বেশিরভাগ শিক্ষাবিদ আমার সাথে একমত হবেন ( https://en.wikedia.org/wiki/Data_s विज्ञान , ইত্যাদি)

যদিও "পরিবেশ বিজ্ঞান" শব্দটি ব্যবহারটি ব্যবসায়ের পরিবেশে বিস্ফোরিত হয়েছে, অনেক শিক্ষাবিদ এবং সাংবাদিক ডেটা বিজ্ঞান এবং পরিসংখ্যানের মধ্যে কোনও পার্থক্য দেখেন না।

তবে যদি আমি কোনও ডেটা বিজ্ঞানীর অবস্থানের জন্য এই সমস্ত চাকরীর সাক্ষাত্কারটি চালিয়ে যাচ্ছি তবে কেন এমন মনে হচ্ছে যে তারা কখনও আমাকে পরিসংখ্যানমূলক প্রশ্ন জিজ্ঞাসা করছে না?

ঠিক আছে আমার শেষ সাক্ষাত্কারের পরে আমি চেয়েছিলাম যে কোনও ভাল বিজ্ঞানী করুক এবং আমি এই সমস্যাটি সমাধানের জন্য ডেটা চেয়েছিলাম (আরে, আমি সর্বোপরি ডেটা বিজ্ঞানী)। যাইহোক, পরে অনেকগুলি গুগল অনুসন্ধান করার পরে, আমি ঠিক সেখানেই শেষ হয়ে গেলাম যেখানে আমি অনুভব করতে শুরু করলাম যেন আমি আবার কোনও তথ্য বিজ্ঞানী কী তার সংজ্ঞা নিয়ে ঝাঁপিয়ে পড়ছি। আমি জানি না যে কোনও তথ্য বিজ্ঞানী ঠিক কীহেতু এর অনেক সংজ্ঞা ছিল, ( http://blog.udacity.com/2014/11/data-sज्ञान-job-skills.html , http: // www -01.ibm.com/software/data/infosphere/data-scientist/ ) তবে দেখে মনে হয়েছিল সবাই আমাকে বলছে আমি এক হতে চাই:

ঠিক আছে, দিন শেষে, আমি যা বুঝতে পেরেছিলাম "একটি তথ্য বিজ্ঞানী কী" উত্তর দেওয়া খুব কঠিন প্রশ্ন। হেক, আমস্টাতে পুরো দুটি মাস ছিল যেখানে তারা এই প্রশ্নের উত্তর দেওয়ার জন্য সময় ব্যয় করেছিল:

আপাতত, ডেটা বিজ্ঞানী হওয়ার জন্য আমাকে সেক্সি পরিসংখ্যানবিদ হতে হবে তবে আশা করি ক্রস বৈধতাযুক্ত সম্প্রদায়টি কিছুটা আলোকপাত করতে সক্ষম হতে পারে এবং ডেটা বিজ্ঞানী হওয়ার অর্থ কী তা বুঝতে আমাকে সহায়তা করতে পারে। সব পরিসংখ্যানবিদরা কি ডেটা বিজ্ঞানী নন?


(সম্পাদনা / আপডেট)

আমি ভেবেছিলাম এটি কথোপকথনটি মশালায়। মাইক্রোসফ্ট একটি ডেটা সায়েন্টিস্ট খুঁজছেন এমন একটি চাকরির বিষয়ে আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের কাছ থেকে আমি কেবল একটি ইমেল পেয়েছি। এখানে লিঙ্কটি রয়েছে: ডেটা সায়েন্টিস্ট পজিশন । আমি মনে করি এটি আকর্ষণীয় কারণ পজিশনের ভূমিকাটি আমরা যে নির্দিষ্ট বৈশিষ্ট্যের সাথে কথা বলেছি তার উপর নির্ভর করে তবে আমি মনে করি যে তাদের মধ্যে অনেকেরই পরিসংখ্যানগুলিতে খুব কঠোর পটভূমি প্রয়োজন, পাশাপাশি নীচে পোস্ট করা অনেকগুলি উত্তরগুলির বিপরীতে। লিঙ্কটি মারা যাওয়ার ক্ষেত্রে, মাইক্রোসফ্ট একটি ডেটা বিজ্ঞানীর কাছে যে গুণাবলীর সন্ধান করছে সেগুলি এখানে:

মূল কাজের প্রয়োজনীয়তা এবং দক্ষতা:

অ্যানালিটিক্স ব্যবহার করে ব্যবসায় ডোমেনের অভিজ্ঞতা

  • জটিল ব্যবসায়ের সমস্যা এবং তাদের সমাধানগুলি বড় আকারের রিয়েল-ওয়ার্ল্ড বিজনেস ডেটা সেটগুলিতে উন্নত বিশ্লেষণগুলি ব্যবহার করে কল্পনা করার জন্য সমালোচনামূলক চিন্তা দক্ষতার ব্যবহারে বেশ কয়েকটি প্রাসঙ্গিক ব্যবসায় ডোমেনের অভিজ্ঞতা থাকতে হবে
  • প্রার্থীকে অবশ্যই বিশ্লেষণাত্মক প্রকল্পগুলি স্বতঃস্ফূর্তভাবে চালাতে সক্ষম হবে এবং আমাদের অভ্যন্তরীণ ক্লায়েন্টদের অনুসন্ধানগুলি বুঝতে এবং তাদের ব্যবসায়ের সুবিধার্থে এটিকে ক্রিয়ায় অনুবাদ করতে সহায়তা করবে।

ভবিষ্যদ্বাণীপূর্ণ মডেলিং

  • ভবিষ্যদ্বাণীপূর্ণ মডেলিংয়ে শিল্প জুড়ে অভিজ্ঞতা
  • ব্যবসায়ের সমস্যা সংজ্ঞা এবং ক্লায়েন্টের সাথে ধারণাগত মডেলিং গুরুত্বপূর্ণ সম্পর্কগুলি নির্ধারণ করতে এবং সিস্টেমের ক্ষেত্রটি সংজ্ঞায়িত করতে

পরিসংখ্যান / অর্থনীতি

  • অবিচ্ছিন্ন এবং শ্রেণিবদ্ধ ডেটার জন্য অনুসন্ধানের ডেটা বিশ্লেষণ
  • প্রয়োজন অনুসারে এন্টারপ্রাইজ এবং ভোক্তাদের আচরণ, উত্পাদন ব্যয়, ফ্যাক্টরের চাহিদা, স্বতন্ত্র পছন্দ এবং অন্যান্য প্রযুক্তির সম্পর্কের জন্য কাঠামোগত মডেল সমীকরণগুলির নির্দিষ্টকরণ এবং অনুমান
  • অবিচ্ছিন্ন এবং বিভাগীয় ডেটা বিশ্লেষণের জন্য উন্নত পরিসংখ্যান কৌশল
  • সময় ধারাবাহিক বিশ্লেষণ এবং পূর্বাভাস মডেলগুলির বাস্তবায়ন
  • একাধিক ভেরিয়েবল সমস্যা নিয়ে কাজ করার জ্ঞান এবং অভিজ্ঞতা
  • মডেল নির্ভুলতা মূল্যায়ন এবং ডায়াগনস্টিক পরীক্ষা পরিচালনা করার ক্ষমতা
  • পরিসংখ্যান বা অর্থনৈতিক মডেলগুলি ব্যাখ্যা করার ক্ষমতা
  • বিচ্ছিন্ন ইভেন্ট সিমুলেশন এবং গতিশীল সিমুলেশন মডেল তৈরির জ্ঞান এবং অভিজ্ঞতা

ডাটা ব্যাবস্থাপনা

  • ডেটা ট্রান্সফারেশনের জন্য টি-এসকিউএল এবং অ্যানালিটিক্স ব্যবহার এবং খুব বড় রিয়েল-ওয়ার্ল্ড ডেটা সেটগুলির জন্য অনুসন্ধানের ডেটা বিশ্লেষণ কৌশল প্রয়োগের সাথে পরিচিতি
  • ডেটা রিডানডেন্সি, ডেটা নির্ভুলতা, অস্বাভাবিক বা চরম মান, ডেটা ইন্টারঅ্যাকশন এবং অনুপস্থিত মান সহ ডেটা অখণ্ডতার প্রতি মনোযোগ।

যোগাযোগ এবং সহযোগিতা দক্ষতা

  • স্বতন্ত্রভাবে কাজ করুন এবং ভার্চুয়াল প্রকল্প দলের সাথে কাজ করতে সক্ষম হোন যা ব্যবসায়ের সমস্যার চ্যালেঞ্জিংয়ের উদ্ভাবনী সমাধানগুলি নিয়ে গবেষণা করবে
  • অংশীদারদের সাথে সহযোগিতা করুন, সমালোচনামূলক চিন্তাভাবনা দক্ষতা প্রয়োগ করুন এবং বিশ্লেষণাত্মক প্রকল্পগুলি শেষ-শেষ পর্যন্ত ড্রাইভ করুন
  • উচ্চতর যোগাযোগ দক্ষতা, মৌখিক এবং লিখিত উভয়ই
  • বিশ্লেষকদের এমন একটি ফর্মের ফলাফলের ভিজ্যুয়ালাইজেশন যা স্টেকহোল্ডারদের বিবিধ সেট দ্বারা গ্রহণযোগ্য

সফ্টওয়্যার প্যাকেজ

  • উন্নত পরিসংখ্যান / একনোমেট্রিক সফ্টওয়্যার প্যাকেজ: পাইথন, আর, জেএমপি, এসএএস, মতামত, এসএএস এন্টারপ্রাইজ খনি
  • ডেটা এক্সপ্লোরেশন, ভিজ্যুয়ালাইজেশন এবং পরিচালনা: টি-এসকিউএল, এক্সেল, পাওয়ারবিআই এবং সমতুল্য সরঞ্জাম

যোগ্যতা:

  • নূন্যতম 5+ বছরের সম্পর্কিত অভিজ্ঞতার প্রয়োজন
  • পরিমাণগত ক্ষেত্রে স্নাতকোত্তর ডিগ্রি আকাঙ্ক্ষিত।

6
সুন্দর প্রশ্ন! আমি ইদানীং এ সম্পর্কে অনেক কিছু ভাবছিলাম। আমার চোখে দেখে মনে হয় যে বর্ণনায় ডেটা বিজ্ঞানী অন্তর্ভুক্ত রয়েছে এমন চাকরিগুলি এমন লোকদের সন্ধান করছে যা পরিসংখ্যান / এমএল পদ্ধতিগুলি ভালভাবে স্কেল করতে পারে, তাত্ত্বিকতার সাথে মোকাবেলা করতে পারে এমন লোকদের প্রয়োজন হয় না। আমি এখনও মনে করি যে এই কাজের বিবরণে কিছুটা বাড়াবাড়ি রয়েছে। পিএইচডি প্রয়োজন সম্ভবত প্রায়শই একটি অযোগ্যতা এবং এইচআর লোকেরা যে এই কাজের বিবরণী তৈরি করে বিগ-ডেটার চারপাশের গুঞ্জন দ্বারা খুব বেশি প্রভাবিত হয়। কোনও ডেটা বিজ্ঞানী কি কোনও পরিসংখ্যানবিদ বা এর বিপরীতে আমি উত্তরটি দেখতে চাই তার প্রধান প্রশ্ন।
গুমেও

4
আমি মনে করি এটি একটি দুর্দান্ত কাগজ যা এই জাতীয় ধরণের পরিসংখ্যানবিদদের তুলনায় ডেটা বিজ্ঞানী হওয়ার সংস্কৃতিতে এই পরিবর্তনকে সম্বোধন করে: প্রজেক্টিউক্লিড.আর.ডাউনলোড
পিডিএফ_1

6
"তবে আমি যদি ডেটা বিজ্ঞানীর অবস্থানের জন্য যদি এই সমস্ত কাজের সাক্ষাত্কার নিয়ে চলে যাই তবে কেন এমন মনে হয় যে তারা আমাকে কখনও পরিসংখ্যানমূলক প্রশ্ন জিজ্ঞাসা করে না" ... আমার জীবনের গল্প ... আক্ষরিকভাবে এলওএল !!! আমি মনে করি তথ্য বিজ্ঞান, পরিসংখ্যান, ইকোনোমেট্রিক্স, বায়োস্ট্যাট, ইত্যাদি etc যথেষ্ট পরিমাণে ওভারল্যাপ রয়েছে তবে তারা সকলেই বিভিন্ন বিভক্ত ব্যবহার করে যা যোগাযোগকে কঠিন করে তোলে (বিশেষত যখন আপনি এইচআর ব্যক্তির দ্বারা সাক্ষাত্কার গ্রহণ করা হয় যা জ্ঞানী নয় এবং মূল শব্দগুলিতে মনোনিবেশ করেন)। আশা করি আন্তঃশাস্তিমূলক প্রচেষ্টা বৃদ্ধি হয়েছে এবং কিছু কিছু খোলামেলা মনোভাব ভবিষ্যতে এটিকে পরিবর্তন করবে।
জাচারি ব্লুমেনফিল্ড

9
২০০৮ সালে মূলধারার হয়ে ওঠার পর থেকেই আমি "তথ্য বিজ্ঞানীর উত্থান" অনুসরণ করেছি me আমার কাছে এটি ছিল এবং বেশিরভাগই একটি বিপণন শব্দ যা একটি হাইপকে জ্বালানী দিয়েছিল - শাখাগুলির পরিসংখ্যান, মেশিন লার্নিং, ডেটা ইঞ্জিনিয়ারিং, ডেটা বিশ্লেষণ সবই বিভিন্ন জোর দিয়ে একই। প্যারাফ্রেসিং জি বক্স: যদি আপনি "আপনি একজন বায়সিয়ান, ঘন ঘন বিশেষজ্ঞ, ডেটা বিশ্লেষক, পরীক্ষার ডিজাইনার, ডেটা বিজ্ঞানী?" এর মতো প্রশ্ন জিজ্ঞাসা করেন তবে? হ্যাঁ বলুন".
মোমো

10
@ মোমো: তবুও, যদি কেউ "মেশিন লার্নিং" (বা অনুরূপ) নামে 600+ পৃষ্ঠাগুলির একটি পাঠ্যপুস্তক এবং "স্ট্যাটিস্টিকস" (বা অনুরূপ) নামে একটি পাঠ্যপুস্তক খোলে, সেখানে খুব অল্প ওভারল্যাপ হবে will আমার বিশপের প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিং বা মরফির মেশিন লার্নিংয়ের লেহম্যান এবং কেসেলা থিওরি অফ পয়েন্টের অনুমান , ক্যাসেলা এবং বার্জারের পরিসংখ্যানগত অনুমান , বা ম্যাক্সওয়েল এবং ডেলানি ডিজাইনিং পরীক্ষাগুলি এবং বিশ্লেষণের সাথে প্রায় জিরো ছেদ রয়েছে । এগুলি এতটাই আলাদা যে আমি মনে করি এক সেট বইয়ের সাথে পরিচিত লোকদের অন্য পড়তে সমস্যা হতে পারে।
অ্যামিবা

উত্তর:


52

কয়েকটি হাস্যকর সংজ্ঞা রয়েছে যা এখনও দেওয়া হয়নি:

ডেটা সায়েন্টিস্ট: কেউ ম্যাকের পরিসংখ্যান করেন।

আমি এটি পছন্দ করি, কারণ এটি আরও হাইপ-থ্রি-পদার্থের কোণে দুর্দান্তভাবে খেলছে।

ডেটা সায়েন্টিস্ট: একজন পরিসংখ্যানবিদ যিনি সান ফ্রান্সিসকোতে থাকেন।

একইভাবে, এই সমস্তটির পশ্চিম উপকূলের স্বাদে এই riffs।

ব্যক্তিগতভাবে, আমি আলোচনাটি (সাধারণভাবে এবং এখানে) কিছুটা বিরক্তিকর এবং পুনরাবৃত্তি খুঁজে পাই। আমি যখন যা চেয়েছিলাম তা নিয়ে ভাবছিলাম --- সম্ভবত এক চতুর্থাংশ শতাব্দী বা তারও বেশি আগে --- আমি পরিমাণগত বিশ্লেষককে লক্ষ্য করেছিলাম। এটি এখনও আমি যা করি (এবং ভালোবাসি!) এবং এটি বেশিরভাগ ক্ষেত্রে ওভারল্যাপ হয় এবং বিভিন্ন উত্তরে এখানে যা দেওয়া হয়েছিল তা coversেকে দেয়।

(দ্রষ্টব্য: দুটি উদ্ধৃতি দেওয়ার জন্য একটি পুরানো উত্স আছে তবে আমি এখনই এটি খুঁজে পাচ্ছি না))


27
+1 টি। I find the discussion (in general, and here) somewhat boring and repetitiveএবং ট্রাইফেলস বা নতুন গুঞ্জনাত্মক শব্দগুলির নিরর্থক আলাপ, আমি যুক্ত করব। আমি এখনও ডেটা বিজ্ঞানী, খ্রিস্টিয়ান বিজ্ঞানী এবং ডেটা সায়েন্টিস্টদের মধ্যে পার্থক্য করতে পারি না।
ttnphns

1
এলএল @ ডেটা বিজ্ঞানীবিদ।
dsaxton

4
এবং আমি আমার টুপিটি (অবশ্যই বেনামে) খুব গুরুতর ব্যক্তিকে টিপ করেছি, যিনি সবেমাত্র এসেছেন, নিম্নমুখী হয়েছিলেন এবং কোনও কারণ ছাড়েন নি। ইঙ্গিত: আলোচনার উন্নতি কীভাবে তা নয়।
ডার্ক এডেলবুয়েটেল

1
দক্ষিণ সান ফ্রান্সিসকোতে একজন পরিসংখ্যানবিদ যিনি ডেটা সায়েন্টিস্ট উপাধিতে খুব সক্রিয়ভাবে লড়াই করছেন, দ্বিতীয় সংজ্ঞাটি বাড়ির খুব কাছাকাছি চলে আসে (তবে আমি ডাউনটি ছিল না)।
ক্লিফ এবি

1
(+1) @ ক্লিফ্যাব আমি আসলে দক্ষিণ সান ফ্রান্সিসকোতেও একটি পরিসংখ্যানবিদ।
রাস্টিস্ট্যাটিস্টিয়ান

87

লোকেরা ডেটা সায়েন্সকে আলাদাভাবে সংজ্ঞায়িত করে তবে আমি মনে করি যে সাধারণ অংশটি হ'ল:

  • ব্যবহারিক জ্ঞান কীভাবে ডেটা মোকাবেলা করতে হবে,
  • ব্যবহারিক প্রোগ্রামিং দক্ষতা।

এর নামের বিপরীতে, এটি খুব কমই "বিজ্ঞান"। এটি হ'ল ডেটা সায়েন্সে ব্যবহারিক ফলাফলগুলিতে জোর দেওয়া হয়েছে (যেমন ইঞ্জিনিয়ারিংয়ের মতো), প্রমাণ নয়, গাণিতিক বিশুদ্ধতা বা একাডেমিক বিজ্ঞানের অনমনীয় বৈশিষ্ট্য। জিনিসগুলি কাজ করা দরকার, এবং এটি যদি কোনও একাডেমিক কাগজ, বিদ্যমান গ্রন্থাগারের ব্যবহার, আপনার নিজস্ব কোড বা একটি অপ্রয়োজনীয় হ্যাকের উপর ভিত্তি করে থাকে তবে সামান্য পার্থক্য থাকে।

পরিসংখ্যানবিদ কোনও প্রোগ্রামার প্রয়োজন হয় না (কলম এবং কাগজ এবং একটি উত্সর্গীকৃত সফ্টওয়্যার ব্যবহার করতে পারে)। এছাড়াও, ডেটা সায়েন্সে কিছু জব কল পরিসংখ্যানের সাথে কোনও সম্পর্ক রাখে না। উদাহরণস্বরূপ, এটি ডেটা ইঞ্জিনিয়ারিং যেমন বড় ডেটা প্রক্রিয়াকরণের মতো, সেখানকার সর্বাধিক উন্নত গণিতগুলি গড় গণনাও করতে পারে (ব্যক্তিগতভাবে আমি এই ক্রিয়াকলাপটিকে "ডেটা সায়েন্স" বলব না)। তদুপরি, "ডেটা সায়েন্স" হাইপড, সুতরাং স্পর্শকাতরভাবে সম্পর্কিত কাজগুলি এই শিরোনামটি ব্যবহার করে - আবেদনকারীদের প্রলুব্ধ করতে বা বর্তমান শ্রমিকদের অহংকার বাড়াতে।

আমি কোওরায় মাইকেল হচ্স্টারের উত্তর থেকে শ্রুতিটি পছন্দ করি :

একটি ডেটা সায়েন্টিস্ট টাইপ করুন: এ বিশ্লেষণের জন্য। এই ধরণেরটি প্রাথমিকভাবে ডেটা বোধ তৈরি করা বা এটির সাথে মোটামুটি স্থিতিশীল ভাবে কাজ করার সাথে সম্পর্কিত। টাইপ এ ডেটা সায়েন্টিস্ট একটি স্ট্যাটিস্টিস্টিয়ান (এবং এটি এক হতে পারে) এর সাথে খুব একই রকম, তবে পরিসংখ্যান পাঠ্যক্রমে শেখানো হয় না এমন ডেটা নিয়ে কাজ করার সমস্ত ব্যবহারিক বিবরণ জানেন: ডেটা পরিষ্কার করা, খুব বড় ডেটা সেটগুলি মোকাবেলার পদ্ধতি, ভিজ্যুয়ালাইজেশন , কোনও নির্দিষ্ট ডোমেনের গভীর জ্ঞান, ডেটা সম্পর্কে ভাল লেখা এবং আরও অনেক কিছু।

টাইপ বি ডেটা সায়েন্টিস্ট: বি বিল্ডিংয়ের জন্য। প্রকার বি ডেটা বিজ্ঞানীরা টাইপ এ এর ​​সাথে কিছু পরিসংখ্যানগত পটভূমি ভাগ করে তবে এগুলি খুব শক্তিশালী কোডার এবং প্রশিক্ষিত সফ্টওয়্যার প্রকৌশলী হতে পারে। টাইপ বি ডেটা সায়েন্টিস্ট প্রধানত ডেটা ব্যবহার করতে আগ্রহী হয় "উত্পাদনে।" তারা এমন মডেল তৈরি করে যা ব্যবহারকারীদের সাথে যোগাযোগ করে, প্রায়শই প্রস্তাবনাগুলি সরবরাহ করে (পণ্য, আপনি যাদের পরিচিত হতে পারেন, বিজ্ঞাপন, চলচ্চিত্র, অনুসন্ধান ফলাফল)।

সেই অর্থে, টাইপ এ ডেটা সায়েন্টিস্ট এমন একজন পরিসংখ্যানবিদ যিনি প্রোগ্রাম করতে পারেন। এমনকি, পরিমাণগত অংশের জন্যও, কম্পিউটার বিজ্ঞানের (যেমন মেশিন লার্নিং) নিয়মিত পরিসংখ্যানের চেয়ে বেশি লোকেরা থাকতে পারে বা ডেটা ভিজ্যুয়ালাইজেশনে যেমন ফোকাস করে।

এবং ডেটা সায়েন্স ভেন ডায়াগ্রাম (এখানে: হ্যাকিং ~ প্রোগ্রামিং):

ডেটা সায়েন্স ভেন ডায়াগ্রাম

বিকল্প ভেন চিত্রগুলি ( এটি এবং এটি )ও দেখুন। বা হাস্যকর হলেও কোনও টুইট , কোনও তথ্য বিজ্ঞানের সাধারণ দক্ষতা এবং ক্রিয়াকলাপের একটি ভারসাম্য তালিকা প্রদর্শন করে:

একটি তথ্য বিজ্ঞানী সক্ষম হতে হবে

এই পোস্টটিও দেখুন: তথ্য বিজ্ঞানী - পরিসংখ্যানবিদ, প্রোগ্রামার, পরামর্শদাতা এবং ভিজ্যুয়ালাইজার?


14
আমি টুইটটি পছন্দ করি। আমি আরও যোগ করব যে তিনি পিজ্জা বেক করতে, নিজস্ব বাস্তুসংক্রান্ত শাকসব্জী জন্মাতে, কবিতা লিখতে এবং নৃত্যের সালসা কীভাবে জানতে হবে :)
টিম

3
মাইনর কুইবল: সমস্ত "বিজ্ঞান" এর "প্রমাণ বা গাণিতিক বিশুদ্ধতা" এর উপর জোর দেওয়া হয় না। উদাঃ যেমন জীববিজ্ঞান।
অ্যামিবা

2
পি-ভ্যালু হ্যাক করার অর্থ কী? আমার কাছে মনে হয় যে কারও (ওরফে ক্লায়েন্ট) একটি নির্দিষ্ট পি-মান টার্গেট পেয়েছে এবং ডেটা বিজ্ঞানীর মনে হয় ডেটা কাটা এবং পাতলা করা হবে যাতে পি-ভ্যালু লক্ষ্য অর্জন করা যায়। নাকি এর আলাদা কিছু বোঝার কথা?
ইমোরি

2
@amory এই টুইটটি humoristic হয় (এটা থেকে একটি অনুচ্ছেদ একটি pastishe এর en.wikiquote.org/wiki/Time_Enough_for_Love , "একজন মানুষের করতে সক্ষম হওয়া উচিত [তালিকা]। বিশেষায়িত ক্ষেত্র পোকামাকড় জন্য।")। "হ্যাক এ পি-ভ্যালু" অবশ্যই একটি অন্ধকার অনুশীলন (দুঃখজনকভাবে, কিছু একাডেমিক শাখায় প্রচলিত) এবং (আমি আশা করি) এখানে রসিকতা হিসাবে উপস্থিত।
পাইটর মিগডাল

4
কাউকে ডেটা সায়েন্টিস্ট না বলে মন্তব্য করার জন্য +1 করুন যিনি প্রচুর ডেটাসেটে সরল "পরিসংখ্যান" গণনা করেন। আমি মনে করি আমরা ডেটা সায়েন্সের এমন এক ধাপের বাইরে চলে যাচ্ছি যেখানে ক্লাস্টার কম্পিউটিংয়ে বিশেষজ্ঞ (কম্পিউটার) হ্যাডোপ ইত্যাদি "কম্পিউটার বিজ্ঞানী" লেবেলযুক্ত কম্পিউটার বিজ্ঞানী ছিলেন। আমি এই দক্ষতাগুলিকে তাকাচ্ছি না, তবে তারা পরিসংখ্যান / যুক্তি / তদন্ত দক্ষতার মতো গুরুত্বপূর্ণ নয় এবং প্রযুক্তিটি মানচিত্র-হ্রাসের বাইরে চলেছে।
ওয়েইন

42

তথ্য বিজ্ঞানের ক্ষেত্রের বেশিরভাগ সমীক্ষা রয়েছে। আমি চাই এই , এক কারণ এটি যারা আসলে তথ্য বিজ্ঞান কাজ রাখা প্রোফাইল বিশ্লেষণ করতে চেষ্টা করে। উপাখ্যানক প্রমাণ বা লেখকের পক্ষপাতদুষ্ট ব্যবহার না করে তারা ডেটা বিজ্ঞান ডিএনএ বিশ্লেষণ করতে তথ্য বিজ্ঞান কৌশল ব্যবহার করে।

এটি ডেটা বিজ্ঞানীদের তালিকাভুক্ত দক্ষতাগুলি দেখতে যথেষ্ট প্রকাশিত। শীর্ষ 20 টি দক্ষতায় আইটি দক্ষতা রয়েছে।

আজকের বিশ্বে, একজন ডেটা বিজ্ঞানী সকল ব্যবসায়ের জ্যাক হিসাবে প্রত্যাশা করছেন; একটি স্ব-শিক্ষানবিস যার দৃ solid় পরিমাণগত ভিত্তি, প্রোগ্রামিংয়ের দক্ষতা, অসীম বৌদ্ধিক কৌতূহল এবং দুর্দান্ত যোগাযোগ দক্ষতা রয়েছে।

এখানে চিত্র বর্ণনা লিখুন

হালনাগাদ:

আমি একজন পরিসংখ্যানবিদ, তবে আমি কি ডেটা বিজ্ঞানী? আমি বৈজ্ঞানিক সমস্যা নিয়ে কাজ করি তাই আমাকে অবশ্যই একজন বিজ্ঞানী হতে হবে!

আপনি যদি পিএইচডি করেন তবে সম্ভবত আপনি ইতিমধ্যে কোনও বিজ্ঞানী রয়েছেন, বিশেষত যদি আপনি কাগজপত্র এবং সক্রিয় গবেষণা প্রকাশ করেছেন। যদিও আপনাকে ডেটা সায়েন্টিস্ট হওয়ার জন্য কোনও বিজ্ঞানী হওয়ার দরকার নেই। ওয়ালমার্টের মতো কিছু সংস্থায় কিছু ভূমিকা রয়েছে (নীচে দেখুন), যেখানে পিএইচডি প্রয়োজন, তবে সাধারণত তথ্য বিজ্ঞানীদের বিএস এবং এমএস ডিগ্রি থাকে যেমন আপনি নীচের উদাহরণ থেকে দেখতে পারেন।

আপনি উপরের চার্টটি থেকে চিত্রটি আবিষ্কার করতে পারেন, সম্ভবত, আপনার কাছে ভাল প্রোগ্রামিং এবং ডেটা হ্যান্ডলিং দক্ষতা থাকতে হবে। এছাড়াও, প্রায়শই ডেটা সায়েন্স কোনও স্তরের সাথে জড়িত থাকে, প্রায়শই "গভীর", মেশিন লার্নিংয়ে দক্ষতার। আপনার স্ট্যাটে পিএইচডি থাকলে আপনি অবশ্যই নিজেকে একটি ডেটা বিজ্ঞানী বলতে পারেন। তবে শীর্ষ বিদ্যালয়গুলির কম্পিউটার বিজ্ঞানে পিএইচডি স্ট্যাটাস গ্র্যাজুয়েটদের চেয়ে বেশি প্রতিযোগিতামূলক হতে পারে, কারণ তাদের কাছে যথেষ্ট শক্তিশালী প্রয়োগের পরিসংখ্যান জ্ঞান থাকতে পারে যা শক্তিশালী প্রোগ্রামিং দক্ষতা দ্বারা পরিপূরক - নিয়োগকর্তাদের সমন্বিত অনুসন্ধানের পরে। তাদের পাল্টানোর জন্য আপনাকে শক্তিশালী প্রোগ্রামিং দক্ষতা অর্জন করতে হবে, যাতে ভারসাম্যের মধ্যে আপনি খুব প্রতিযোগিতামূলক হবেন। মজার বিষয়টি হ'ল সাধারণত সমস্ত স্ট্যাটাস পিএইচডিগুলির কিছু প্রোগ্রামিং অভিজ্ঞতা থাকে তবে ডেটা সায়েন্সে প্রায়শই প্রয়োজনীয়তা এর চেয়ে অনেক বেশি থাকে,

আমার কাছে পরিসংখ্যানগুলিতে পিএইচডি করার সুবিধাটি হ'ল "সমস্ত ব্যবসায়ের একটি জ্যাক" বাক্যটির বাক্যটিতে সাধারণত যে সমস্যাটি হয় তা হ'ল: "মাস্টার অব ন ম্যান"। এমন লোকদের কাছে রাখা ভাল যা কিছুটা কিছুটা জানত, তবে আমি সবসময় এমন লোকদের সন্ধান করি যারা গভীরভাবে কিছু জানে, যদিও তা পরিসংখ্যান বা কম্পিউটার বিজ্ঞান এতটা গুরুত্বপূর্ণ নয়। যে বিষয়টি গুরুত্বপূর্ণ তা হল লোকটি নীচে পৌঁছতে সক্ষম, আপনি যখন প্রয়োজন তখন এটি একটি কার্যকর গুণ।

সমীক্ষায় তথ্য বিজ্ঞানীদের শীর্ষ নিয়োগকারীদের তালিকাভুক্ত করা হয়। মাইক্রোসফ্ট শীর্ষে আছে, স্পষ্টতই, যা আমার জন্য অবাক হয়েছিল। তারা কী খুঁজছেন সে সম্পর্কে যদি আপনি আরও ভাল ধারণা পেতে চান তবে জবস বিভাগে "ডেটা সায়েন্স" দিয়ে লিনকইন অনুসন্ধান করা সহায়ক। লিঙ্কডইনে এমএস এবং ওয়ালমার্টের চাকরির দুটি অংশের নীচে একটি কথা বলা হয়েছে।

  • মাইক্রোসফ্ট ডেটা সায়েন্টিস্ট

    • ডেটা প্রসেসিং সিস্টেম / পরিষেবাদি নির্মাণে 5+ বছরের সফটওয়্যার বিকাশের অভিজ্ঞতা
    • কম্পিউটার সায়েন্স, ইই, বা স্ট্যাটিস্টিক্স, ডেটা মাইনিং বা মেশিন লার্নিংয়ের বিশেষজ্ঞের সাথে গণিতে স্নাতক বা উচ্চতর যোগ্যতা।
    • বড় আকারের ডেটা ম্যানিপুলেট করার ক্ষেত্রে দুর্দান্ত প্রোগ্রামিং দক্ষতা (সি #, জাভা, পাইথন, ইত্যাদি)
    • হাদোপ বা অন্যান্য বিগ ডেটা প্রসেসিং প্রযুক্তির কাজের জ্ঞান
    • অ্যানালিটিক্স পণ্যগুলির জ্ঞান (যেমন আর, এসকিউএল এএস, এসএএস, মাহাউট ইত্যাদি) একটি প্লাস।

লক্ষ্য করুন, স্ট্যাটাস প্যাকেজগুলি কীভাবে জানার জন্য এটি কেবল একটি প্লাস, তবে জাভাতে দুর্দান্ত প্রোগ্রামিং দক্ষতা প্রয়োজন।

  • ওয়ালমার্ট, ডেটা সায়েন্টিস্ট

    • কমপক্ষে 2-5 বছরের সম্পর্কিত অভিজ্ঞতার সাথে কম্পিউটার সায়েন্স বা অনুরূপ ক্ষেত্রে পিএসডি বা এমএস করতে পারেন
    • সি ++ বা জাভাতে কার্যকর কার্যকরী কোডিং দক্ষতা (জাভা অত্যন্ত পছন্দনীয়)
    • সি ++ / জাভা / হাদুপ / হাইভ উভয় ক্ষেত্রেই কোড কোড প্রযোজনায় 10% পর্যন্ত দৈনিক কাজের দিন ব্যয় করতে সক্ষম হতে হবে
    • পাইথন বা পার্লের মতো স্ক্রিপ্টিং ভাষার একটির বিশেষজ্ঞের স্তরের জ্ঞান।
    • বড় ডেটা সেট এবং বিতরণ করা কম্পিউটিং সরঞ্জামগুলিতে একটি প্লাস (মানচিত্র / হ্রাস, হাদুপ, মধুশ, স্পার্ক ইত্যাদি) নিয়ে কাজ করার অভিজ্ঞতা

এখানে, পিএইচডি পছন্দ করা হয়, তবে কেবল কম্পিউটার বিজ্ঞানের মেজর নামকরণ করা হয়। হ্যাডোপ বা স্পার্কের সাথে বিতরণ করা কম্পিউটিং সম্ভবত কোনও পরিসংখ্যানবিদদের পক্ষে একটি অস্বাভাবিক দক্ষতা, তবে কিছু তাত্ত্বিক পদার্থবিজ্ঞানী এবং প্রয়োগিত গণিতবিদ একই ধরণের সরঞ্জাম ব্যবহার করেন।

আপডেট 2:

"ডেটা সায়েন্টিস্ট" শিরোনাম "ইটল টাইম টু মের" ডেটা সায়েন্টিস্ট "শিরোনাম" বলেছেন যে টমাস ডেভেনপোর্ট ২০১২ সালে হার্ভার্ড বিজনেস রিভিউতে নিবন্ধটি সহ " লিখেছিলেন ডেটা সায়েন্টিস্ট: একুশ শতাব্দীর সেক্সিস্ট জব" শিরোনামে এইভাবে তথ্য বিজ্ঞানীর ক্রেজ শুরু হয়েছিল:

আজ আপনার নিজের বলা বা, হতে চান, বা ভাড়া নেওয়াতে — একটি "ডেটা বিজ্ঞানী?" বলতে দুর্ভাগ্যবশত এর অর্থ কী?


3
ডেটা ব্যবহার এবং একটি দুর্দান্ত ডেটা চালিত প্রতিবেদনে লিঙ্ক করার জন্য +1। তবে কি স্ক্রিনশটের কোনও ওয়েব ব্রাউজার ইন্টারফেসের প্রয়োজন?
পাইটর মিগডাল

@ পাইওট্র মিগডাল, আমার ফসল শিখতে বা অলস হওয়া বন্ধ করা উচিত
আকসকল

4
আমি আপনার জন্য এটি ক্রপ।
অ্যামিবা

1
আমি আজকের আপডেটের পরে ডাউনটোটে প্রলুব্ধ হয়ে আছি: এই থ্রেডটি ইতিমধ্যে খুব ব্যস্ত এবং নীচে স্ক্রোল করার জন্য উদ্ধৃতিগুলির একটি বিশাল প্রাচীর থাকা আমার মতে খুব কার্যকর নয় ... সম্ভবত লিঙ্কগুলি + সংক্ষিপ্তসার সংক্ষিপ্তসারই যথেষ্ট হতে পারে?
অ্যামিবা

1
@ আমেবা, আমি তালিকাটি সরিয়ে নিই। এটি একটি নিখুঁত মন্তব্য
আকসকল

39

কোথাও আমি এটি পড়েছি (সম্পাদনা: জোশ উইল তার টুইটটি ব্যাখ্যা করছেন ):

ডেটা সায়েন্টিস্ট এমন ব্যক্তি যিনি কোনও প্রোগ্রামারের চেয়ে পরিসংখ্যানের চেয়ে ভাল এবং কোনও পরিসংখ্যানবিদদের চেয়ে প্রোগ্রামিংয়ে আরও ভাল।

এই তথ্যটি শীঘ্রই এই তথ্য বিজ্ঞান প্রক্রিয়া দ্বারা ব্যাখ্যা করা যেতে পারে । এই স্কিমটির প্রথম চেহারাটি "ভাল, প্রোগ্রামিং অংশটি কোথায়?" বলে মনে হচ্ছে তবে আপনার যদি প্রচুর পরিমাণে ডেটা থাকে তবে আপনাকে সেগুলি প্রক্রিয়া করতে সক্ষম হতে হবে।


11
সুতরাং সম্ভবত প্রতিটি আর অবদানকারী যে একটি পরিসংখ্যানবিদ একটি তথ্য বিজ্ঞানী? ;)
টিম

15
বাহ, আমি কেবল সাইটটি ঘুরে বেড়াচ্ছিলাম , এই প্রশ্নটি সম্পর্কে অবাক হয়ে যাচ্ছি (সেখানে ডেটা বিজ্ঞান দেওয়া আছে ) এবং তারপরে পাস করার সময় জানতে পারি যে আমার একটি ফ্রিগিন 'উইকিপিডিয়া পৃষ্ঠা আছে ? এটি আমার কাছে সংবাদ ছিল ... এবং এটির মূল্য কীসের জন্য আমি পরিসংখ্যান নয়, একনোমেট্রিক্সে প্রশিক্ষিত হয়েছি, তবে 20+ বছর ধরে 'কোয়ান্ট' হিসাবে কাজ করেছি। এটি কার্যকরভাবে ডেটা সায়েন্সের মতো ...
ডার্ক এডেলবুয়েটেল

3
-1। আমার উক্তিটি এই কারণে নয় যে আমি উক্তিটি পছন্দ করি না (এটি সম্ভবত গালে জিহ্বা ছিল), তবে কারণ উত্তরটি খুব সংক্ষিপ্ত এবং অস্বীকারযোগ্য, বিশেষত এখানে অন্যান্য অনেক উত্তরের তুলনায়। আমি আপনাকে এটি কোনও মন্তব্যে রূপান্তরিত করার পরামর্শ দেব, যদি না আপনি সম্ভবত এটি কোনওভাবে প্রসারিত করেন।
অ্যামিবা

3
এখানে এর লেখক জোশ উইলসের এই উক্তিটির ব্যাখ্যা দেওয়া হল । উক্তিটির পরে প্রথম তিনটি অনুচ্ছেদ এই আলোচনার জন্য যথেষ্ট প্রাসঙ্গিক।
অ্যামিবা

3
@ মোয়েবা: আমি জোশ উইলসের নিবন্ধটি এ পর্যন্ত পছন্দ করেছি: "আমি সন্দেহ করি যে আমরা মানুষকে এমনভাবে প্যারামেট্রিক মডেলের দিকে মনোনিবেশ করে কম্পিউটার বিজ্ঞানীদের ভয় দেখাতে শেখায় যে উন্নত পরিসংখ্যান শেখায় যেগুলির জন্য নন-প্যারাম্যাট্রিক মডেলের পরিবর্তে প্রচুর ক্যালকুলাস প্রয়োজন people যেগুলি প্রাথমিকভাবে গণনাযোগ্য "। এছাড়াও, আমি তার সাথে একমত নই যে পরিসংখ্যানবিদদের কাছে কীভাবে ভাল প্রোগ্রাম করা যায় তার চেয়ে সিএস লোককে উন্নত পরিসংখ্যান শেখানো আরও সহজ (যদিও আমি অবশ্যই একমত যে বেশিরভাগ পরিসংখ্যানবিদরা ভয়ানক প্রোগ্রামার)।
ক্লিফ এবি

15

আমি বেশ কয়েকটি উত্তর লিখেছি এবং প্রতিবার সেগুলি দীর্ঘ হয়ে গেছে এবং শেষ পর্যন্ত আমি সিদ্ধান্ত নিয়েছি যে আমি একটি সাবানবক্সে উঠছি। তবে আমি মনে করি যে এই কথোপকথন দুটি গুরুত্বপূর্ণ বিষয় পুরোপুরি অন্বেষণ করে নি:

  1. বিজ্ঞান ডেটা বিজ্ঞান। একটি বৈজ্ঞানিক পন্থা হ'ল এটিতে আপনি নিজের মডেলগুলি, তত্ত্বগুলি, বৈশিষ্ট্যগুলি, কৌশলগুলির পছন্দগুলি ইত্যাদি ধ্বংস করার চেষ্টা করেন এবং আপনি যখন এটি করতে না পারেন কেবল তখনই আপনি স্বীকার করেন যে আপনার ফলাফলগুলি কার্যকর হতে পারে। এটি একটি মানসিকতা এবং আমার সাথে দেখা অনেকগুলি সেরা ডেটা সায়েন্টিস্টের হার্ড-সায়েন্স ব্যাকগ্রাউন্ড রয়েছে (রসায়ন, জীববিজ্ঞান, প্রকৌশল)।

  2. ডেটা সায়েন্স একটি বিস্তৃত ক্ষেত্র। একটি ভাল ডেটা সায়েন্স ফলাফল সাধারণত তাদের নিজস্ব বৈশিষ্ট্য সহ প্রতিটি তথ্য বিজ্ঞানীর একটি ছোট দল জড়িত। উদাহরণস্বরূপ, এক দলের সদস্য আরও কঠোর এবং পরিসংখ্যানগত, অন্যজন ইঞ্জিনিয়ারিং ব্যাকগ্রাউন্ড সহ একটি ভাল প্রোগ্রামার এবং অন্যজন ব্যবসার বুদ্ধি নিয়ে দৃ strong় পরামর্শদাতা। তিনটিই বিষয়টি শিখতে তাত্পর্যপূর্ণ এবং তিনটিই কৌতূহলী এবং সত্যটি খুঁজে পেতে চায় - তবে বেদনাদায়ক - এবং গ্রাহক না করলেও (অভ্যন্তরীণ বা বাহ্যিক) গ্রাহকের সেরা স্বার্থে যা করতে চান তা করতে ' t বুঝতে.

বিগত কয়েক বছর ধরে এই অদ্ভুততা - এখন আমি ম্লান হয়ে যাচ্ছি - আমার মনে হয় - এমন কম্পিউটার বিজ্ঞানীদের নিয়োগ দেওয়া যাঁরা ক্লাস্টার প্রযুক্তি (হ্যাডোপ ইকোসিস্টেম, ইত্যাদি) বিষয়ে দক্ষতা অর্জন করেছেন এবং বলেছিলেন যে এটি আদর্শ ডেটা সায়েন্টিস্ট। আমি মনে করি যে ওপি এর মুখোমুখি হয়েছিল এবং আমি ওপিকে তাদের শক্তিকে কঠোরতা, সঠিকতা এবং বৈজ্ঞানিক চিন্তাভাবনার দিকে ঠেলে দেওয়ার পরামর্শ দেব।


@ রুস্টি স্ট্যাটিস্টিশিয়ান: আপনাকে স্বাগতম। আমি যুক্ত করব যে আমি যে পরামর্শের জন্য কাজ করি সেগুলিতে পিএইচডি (ইঞ্জিনিয়ারিং, জীববিজ্ঞান, জ্যোতির্বিজ্ঞান, কম্পিউটার বিজ্ঞান) রয়েছে তবে সাধারণ দৃষ্টিতে এমএস ডিগ্রি রয়েছে - প্রায়শই কাজের অভিজ্ঞতা সম্পন্ন লোকেরা যারা অ্যানালিটিক্সে এমএসের জন্য ফিরে যান - মিষ্টি স্পট হিসাবে । এটি বলেছিল, আমি প্রতিদিন আমার জীববিজ্ঞান পিএইচডি সহকর্মীর জন্য কৃতজ্ঞ, যিনি বর্তমানে এমন একটি প্রকল্পে রয়েছেন যেখানে আমি প্রযুক্তি নেতৃত্ব দিচ্ছি। প্রকল্পের নেতৃত্বের সাথে যার অর্থনীতি ব্যাকগ্রাউন্ড রয়েছে (এবং বিশ্লেষণে এমএস) রয়েছে, আমরা দুর্দান্ত দল! (আমার এমএস কৃত্রিম বুদ্ধিমত্তায় রয়েছে))
ওয়েন

+1 টি, কিন্তু আমি বলার অপেক্ষা রাখে না যে [ভাল] তথ্য বিজ্ঞান আপনার প্রথম বুলেট পয়েন্ট সম্পর্কে হতাশ করছি হয় একটি বিজ্ঞান। যদি তা হয় তবে এটি একটি কৌতূহল এবং সম্ভবত একটি বিভ্রান্তিমূলক (?) শব্দ, কারণ "তথ্য বিজ্ঞান" নিজেই "ডেটা" অধ্যয়ন করে না; এটি প্রদত্ত অ্যাপ্লিকেশনটির জন্য আগ্রহী যাই হোক না কেন, অন্য কিছু অধ্যয়নের জন্য ডেটা ব্যবহার করছে। বিপরীতে, উদাহরণস্বরূপ "রাষ্ট্রবিজ্ঞান" রাজনীতি অধ্যয়ন করার কথা এবং নামগুলি সূচিতভাবে "নিউরোসায়েন্স" নিউরনগুলি অধ্যয়ন করছে।
অ্যামিবা

1
@ অ্যামিবা: আসলে, আমি বোঝাতে চেয়েছিলাম যে ডেটা সায়েন্টিস্টকে অবশ্যই কীভাবে তারা ডেটা বোঝে এবং ব্যবহার করতে পারে তার একটি অংশ হিসাবে বৈজ্ঞানিক পদ্ধতি আলা রিচার্ড ফেনম্যানকে ব্যবহার করতে হবে। (যেমন আপনি বলেছেন, কোনও বিশেষ প্রয়োগের সন্ধানে)) এটি কাজের পরিসংখ্যানবিদ অংশ: "এই পরিবর্তনশীলটি অত্যন্ত তাৎপর্যপূর্ণ বলে মনে হচ্ছে - এটি কি ভবিষ্যতের থেকে ফাঁস?" অথবা "এই মডেলটি যুক্তিসঙ্গত বলে মনে হচ্ছে, তবে আসুন আমরা পুরো মডেল তৈরির প্রক্রিয়াতে সিভি চালাই এবং তারপরে কিছুটা পুনর্নির্মাণ করা যাক।" এটি আপনার মডেল / তত্ত্বকে অস্বীকার করার জন্য এবং অন্যকে এটি করার সাথে জড়িত করার জন্য কঠোর চেষ্টা করছে। "গ্রিন এম অ্যান্ড এমএস ক্যান্সারের কারণ" গ্রহণ না করা।
ওয়েইন

@ ওয়াইনই কেবলমাত্র যারা এখনও অবধি "বৈজ্ঞানিক পদ্ধতি" উল্লেখ করেছেন। এতো দুঃখজনক।
jgomo3

যে কোনও কিছু বোঝার চেষ্টা করার জন্য পদার্থবিজ্ঞান, বিশেষত ইউনিটগুলির বোঝা প্রয়োজনীয়। তবে, আমাদের এই সাহসী নতুন বিশ্বে প্রায়শই হিউরিস্টিক পর্যবেক্ষণ করা যথেষ্ট যে "গব-স্টপার্স" হিসাবে উপ-অনুকূল ভবিষ্যদ্বাণীমূলক মান রয়েছে তবে এটি প্রকৃত সমাধান নয়।
কার্ল

14

আমি মনে করি বিটওয়াইস আমার বেশিরভাগ উত্তর কভার করে তবে আমি আমার 2 সি যোগ করতে চাই।

না, আমি দুঃখিত, তবে পরিসংখ্যানবিদ কোনও তথ্য বিজ্ঞানী নন, অন্তত বেশিরভাগ সংস্থাগুলির ভূমিকা আজকে কীভাবে সংজ্ঞায়িত করা হয় তার ভিত্তিতে। নোট করুন যে সংজ্ঞা সময়ের সাথে সাথে পরিবর্তিত হয়েছে, এবং অনুশীলনকারীদের একটি চ্যালেঞ্জ হ'ল তারা প্রাসঙ্গিক রয়েছেন তা নিশ্চিত করা।

আমরা কেন "ডেটা সায়েন্টিস্ট" ভূমিকার জন্য প্রার্থীদের প্রত্যাখ্যান করি তার কয়েকটি সাধারণ কারণগুলি ভাগ করব:

  • কাজের সুযোগ সম্পর্কে প্রত্যাশা । সাধারণত ডিএসের স্বতন্ত্রভাবে কাজ করতে সক্ষম হওয়া প্রয়োজন। তার অর্থ, তাকে অর্পিত সমস্যাটি সমাধান করার জন্য তার জন্য ডেটাসেট তৈরি করার মতো আর কেউ নেই। সুতরাং, তাকে ডেটা উত্সগুলি সন্ধান করতে, সেগুলি জিজ্ঞাসা করতে, একটি সমাধানের মডেল তৈরি করতে এবং তারপরে প্রায়শই সমস্যা সমাধানের জন্য একটি প্রোটোটাইপ তৈরি করতে সক্ষম হওয়া প্রয়োজন। অনেক সময় এটি ড্যাশবোর্ড, অ্যালার্ম বা একটি লাইভ রিপোর্ট যা ক্রমাগত আপডেট হয় the
  • যোগাযোগ । দেখে মনে হচ্ছে, অনেক পরিসংখ্যানবিদদের ব্যবসায়ের লোকদের কাছে তাদের ধারণাগুলি "সরলকরণ" এবং "বিক্রয়" করা কঠিন সময় রয়েছে। আপনি কি কেবল একটি গ্রাফ প্রদর্শন করতে পারেন এবং ঘরের প্রত্যেকে এটি পেতে পারে এমন উপায়ে ডেটা থেকে একটি গল্প বলতে পারেন? দ্রষ্টব্য, আপনি সুরক্ষিত করার পরে এটি হ'ল চ্যালেঞ্জ জানানো হলে আপনি বিশ্লেষণের প্রতিটি বিট রক্ষা করতে পারেন।
  • কোডিং দক্ষতা । আমাদের প্রোডাকশন লেভেল কোডিং দক্ষতা প্রয়োজন নেই, যেহেতু এর জন্য আমাদের বিকাশকারী রয়েছে তবে আমাদের দরকার তার প্রোটোটাইপ লিখতে এবং এটি একটি এডাব্লুএস ইসি 2 ইভেন্টে ওয়েব পরিষেবা হিসাবে স্থাপন করতে সক্ষম হওয়া দরকার। সুতরাং, কোডিং দক্ষতার অর্থ আর স্ক্রিপ্টগুলি লেখার ক্ষমতা নয়। আমি সম্ভবত এখানে কোথাও লিনাক্সে সাবলীল যোগ করতে পারি। সুতরাং, বেশিরভাগ পরিসংখ্যানবিদদের বিশ্বাস করার চেয়ে বারটি কেবলমাত্র উচ্চ higher
  • এসকিউএল এবং ডাটাবেস । না, তিনি এই কাজটি নিতে পারবেন না, যেহেতু আমাদের প্রয়োজন তার যে বেসিক এসকিউএলটি ইতিমধ্যে জানা আছে সেটিকে খাপ খাইয়ে নিতে হবে এবং রেডশিফ্ট, এইচআইভি এবং প্রেস্টো সহ আমরা org জুড়ে যে একাধিক ডিবি সিস্টেম ব্যবহার করি সেগুলি কীভাবে জিজ্ঞাসা করতে হবে তা শিখি - প্রত্যেকে যা এসকিউএল এর নিজস্ব স্বাদ ব্যবহার করে। এছাড়াও, কাজের উপর এসকিউএল শেখার অর্থ প্রার্থীরা দক্ষ বিশদগুলি কীভাবে লিখতে শিখেন যতক্ষণ না তারা প্রতিটি অন্যান্য বিশ্লেষককে সমস্যা তৈরি করে।
  • মেশিন লার্নিং । সাধারণত তারা প্রদত্ত ডেটাসেট (ক্যাগল স্টাইল) এর উপর ভিত্তি করে কোনও সমস্যা সমাধানের জন্য লজিস্টিক রিগ্রেশন বা কয়েকটি অন্যান্য কৌশল ব্যবহার করেছে। যাইহোক, এমনকি সাক্ষাত্কারটি অ্যালগরিদম এবং পদ্ধতিগুলি থেকে শুরু হয়, শীঘ্রই এটি বৈশিষ্ট্য প্রজন্মের মতো বিষয়গুলিতে ফোকাস করে (মনে রাখবেন আপনাকে ডেটাসেট তৈরি করা দরকার, এটির জন্য আপনাকে তৈরি করার মতো আর কেউ নেই), রক্ষণাবেক্ষণযোগ্যতা, স্কেলাবিলিটি এবং পারফরম্যান্স পাশাপাশি সম্পর্কিত বাণিজ্য বন্ধ। কিছু প্রসঙ্গে আপনি এনআইপিএস 2015 এ প্রকাশিত গুগলের কাছ থেকে কোনও প্রাসঙ্গিক কাগজ দেখতে পারেন ।
  • পাঠ্য বিশ্লেষণ । অবশ্যই থাকা উচিত নয়, তবে প্রাকৃতিক ভাষা প্রসেসিংয়ের কিছু অভিজ্ঞতা থাকা ভাল। সর্বোপরি, ডেটার একটি বড় অংশ পাঠ্য বিন্যাসে। আলোচিত হিসাবে কোনও এমএল বা অন্যান্য পরিসংখ্যানিক পদ্ধতির মাধ্যমে এটি গ্রাহ্যযোগ্য করার জন্য আপনার জন্য পাঠ্যটি রূপান্তর করতে এবং পরিষ্কার করার জন্য আর কেউ নেই। এছাড়াও, মনে রাখবেন যে আজও সিএস গ্রেড ইতিমধ্যে কিছু প্রকল্প করেছে যা এই বাক্সটিকে টিক দেয়।

অবশ্যই একটি জুনিয়র ভূমিকার জন্য আপনার উপরের সমস্ত থাকতে পারে না। তবে, এই দক্ষতাগুলির মধ্যে কতটি আপনি অনুপস্থিত এবং চাকরীটি নিতে পারবেন?

পরিশেষে, স্পষ্ট করে বলতে গেলে অ-পরিসংখ্যানবিদদের প্রত্যাখ্যান করার সর্বাধিক সাধারণ কারণ হ'ল পরিসংখ্যান এমনকি মৌলিক জ্ঞানের অভাব। এবং কোথাও একটি তথ্য ইঞ্জিনিয়ার এবং একটি তথ্য বিজ্ঞানী মধ্যে পার্থক্য আছে। তবুও, ডেটা ইঞ্জিনিয়াররা এই ভূমিকাগুলির জন্য আবেদন করার ঝোঁক রাখেন, যেহেতু অনেক সময় তারা বিশ্বাস করেন যে "পরিসংখ্যান" কেবলমাত্র গড়, বৈচিত্র এবং সাধারণ বিতরণ। সুতরাং, "পরিসংখ্যান" দ্বারা আমরা কী বোঝাতে চাইছি এবং বিভ্রান্তি রোধ করতে আমরা কাজের বিবরণীতে কয়েকটি প্রাসঙ্গিক কিন্তু ভীতিজনক পরিসংখ্যানের buzzwords যুক্ত করতে পারি।


4
২০০ Since সাল থেকে আমি দুটি বিশ্ববিদ্যালয়ে "বিজনেস ইনফরম্যাটিকস" নামক প্রোগ্রামগুলিতে প্রয়োগ পরিসংখ্যান এবং ডেটা বিশ্লেষণ কোর্স শিখি এবং এটি আমার শিক্ষার্থীরা যা শিখছে তার ক্ষেত্রে এটি 100% প্রযোজ্য। ১. তাদের ব্যবসা, ওয়েব, জরিপ ইত্যাদি থেকে বাস্তব, সম্ভবত অগোছালো তথ্য সংগ্রহ করা দরকার 2.. কোর্সের জন্য কোনও এসকিউএল ডেটা বেসে ডেটা পরিষ্কার, প্রস্তুত এবং সংরক্ষণ করতে হবে। ৩. ডেটা সম্পর্কিত বিভিন্ন পরিসংখ্যান বিশ্লেষণ করুন। ৪-২ পৃষ্ঠাগুলির সংক্ষিপ্ত কার্যনির্বাহী সংক্ষিপ্ত বিবরণ প্রস্তুত করুন এবং আক্ষরিক প্রোগ্রামিংয়ের সাথে একটি নিবিড় প্রতিবেদন লিখুন (নিটার বা লাইক)। সেই ডেটা থেকে বিজ্ঞান কি অতিরিক্ত পরিসংখ্যান / এমএল কোর্স সহ ব্যবসায়ের তথ্যাদি, না?
মোমো

4
অবশ্যই, আপনার কোর্সে প্রয়োজনীয় দক্ষতা অনেকগুলি রয়েছে। আমি মনে করি আমরা প্রচুর সংমিশ্রণগুলি খুঁজে পেতে পারি, যেমন, কিছু স্ট্যাটাস কোর্স সহ কম্পিউটার সায়েন্স ডিগ্রি এবং একটি ব্যবসায় এমএল-ভিত্তিক সমস্যা সম্পর্কিত থিসিস / ইন্টার্নশিপ। দিনের শেষে, কী গুরুত্বপূর্ণ তা প্রার্থীর টেবিলে প্রাসঙ্গিক দক্ষতার গভীরতা এবং প্রস্থতা ।
ilasfl

11

আমাকে হাইপ এবং বুজওয়ার্ডগুলি উপেক্ষা করার অনুমতি দিন। আমি মনে করি "ডেটা সায়েন্টিস্ট" (বা যা আপনি এটি কল করতে চান) একটি আসল জিনিস এবং এটি একটি পরিসংখ্যানবিদ থেকে পৃথক। এমন অনেক ধরণের অবস্থান রয়েছে যা কার্যকরভাবে ডেটা বিজ্ঞানী হয় তবে তাদের নাম দেওয়া হয় না - একটি উদাহরণ হ'ল জিনোমিক্সে কাজ করা লোক।

আমি যেভাবে দেখছি, একজন ডেটা বিজ্ঞানী হলেন এমন ব্যক্তি যিনি বিপুল পরিমাণে জটিল জটিল তথ্যের উপর গবেষণার নকশা তৈরি ও সম্পাদন করার দক্ষতা এবং দক্ষতা অর্জন করেছেন (উদাহরণস্বরূপ উচ্চ মাত্রিক যার মধ্যে অন্তর্নিহিত প্রক্রিয়াগুলি অজানা এবং জটিল)।

এর অর্থ:

  • প্রোগ্রামিং: বিশ্লেষণ এবং পাইপলাইনগুলি বাস্তবায়িত করতে সক্ষম হওয়া, প্রায়শই কিছু স্তরের সমান্তরালনের প্রয়োজন হয় এবং ডেটাবেস এবং উচ্চ-কার্যকারিতা কম্পিউটিং সংস্থাগুলির সাথে ইন্টারফেসিং প্রয়োজন।
  • কম্পিউটার সায়েন্স (অ্যালগোরিদম): দক্ষ অ্যালগরিদমগুলির ডিজাইনিং / নির্বাচন করা যেমন নির্বাচন করা বিশ্লেষণ সম্ভব এবং ত্রুটির হার নিয়ন্ত্রণ করা হয়। কখনও কখনও এটির জন্য সংখ্যা বিশ্লেষণ, অপ্টিমাইজেশন ইত্যাদির জ্ঞানও প্রয়োজন হতে পারে Sometimes
  • কম্পিউটার বিজ্ঞান / পরিসংখ্যান (সাধারণত মেশিন লার্নিংয়ের উপর জোর দেওয়া): ডেটাতে প্রশ্ন জিজ্ঞাসা করতে বা এতে "নিদর্শন" সন্ধানের জন্য একটি কাঠামো ডিজাইন করা এবং প্রয়োগ করা। এর মধ্যে কেবলমাত্র বিভিন্ন পরীক্ষা / সরঞ্জাম / অ্যালগরিদমের জ্ঞানই নয় তবে কীভাবে সঠিক হোল্ডআউট, ক্রস-বৈধকরণ এবং আরও কীভাবে ডিজাইন করা যায়।
  • মডেলিং: প্রায়শই আমরা এমন কিছু মডেল তৈরি করতে সক্ষম হতে চাই যা তথ্যগুলির একটি সহজ উপস্থাপনা দেয় যেমন আমরা উভয় কার্যকর ভবিষ্যদ্বাণী করতে পারি এবং ডেটা অন্তর্নিহিত পদ্ধতিগুলির অন্তর্দৃষ্টি অর্জন করতে পারি। সম্ভাব্য মডেলগুলি এটির জন্য খুব জনপ্রিয়।
  • ডোমেন-নির্দিষ্ট দক্ষতা: জটিল ডেটা সহ সফলভাবে কাজ করার একটি মূল দিক হ'ল ডোমেন-নির্দিষ্ট অন্তর্দৃষ্টি অন্তর্ভুক্ত করা। সুতরাং আমি বলব যে ডেটা বিজ্ঞানী যেহেতু ডোমেনে দক্ষতা অর্জন করতে পারেন, দ্রুত নতুন ক্ষেত্র শিখতে সক্ষম হন বা ক্ষেত্রের বিশেষজ্ঞদের সাথে ভালভাবে ইন্টারফেস করতে সক্ষম হওয়া উচিত যা ডেটা সম্পর্কে কীভাবে যোগাযোগ করা যায় সে সম্পর্কে দরকারী অন্তর্দৃষ্টি অর্জন করতে পারে ।

6
এবং আপনার মতে একটি পরিসংখ্যানবিদ কে? "পরিসংখ্যানবিদ" থাকা দক্ষতার চেয়ে এই দক্ষতার তালিকা কীভাবে আলাদা?
অ্যামিবা

4
@ মোয়েবা আমি ভুল হতে পারি, তবে অনেক পরিসংখ্যানবিদদের মধ্যে এই দক্ষতাগুলির কিছু নেই (যেমন বিশাল ডেটাসেট সহ বিস্তৃত প্রোগ্রামিং, কম্পিউটার বিজ্ঞানে স্নাতক স্তরের প্রশিক্ষণ)। এছাড়াও, কিছু পরিসংখ্যানগত দক্ষতা প্রায়শই ডেটা বিজ্ঞানী (কিছু তত্ত্বের, কিছু উপ-ক্ষেত্র) এর জন্য অপ্রাসঙ্গিক।
বিটওয়াইজ

4
@rocinante: আমি দৃঢ়ভাবে অসম্মতি যে " 'বৃহদায়তন ডেটাসেট' দিয়ে প্রোগ্রামিং সত্যিই একটি hinderance নয়।" আমি মনে করি না যে আমি "পরিসংখ্যানবিদ" শিরোনামযুক্ত এমন কাউকে জানি যারা এমন একটি সফ্টওয়্যার প্রয়োগ করতে পারে যা একটি সার্ভারে আগত প্যাকেটের ভিত্তিতে রিয়েল টাইম সিদ্ধান্ত নেয়। অবশ্যই সমস্ত ডেটা বিজ্ঞানীরা হয় না, তবে অনুপাত অনেক বেশি।
ক্লিফ এবি

3
@ ক্রিন্যান্টে পরিসংখ্যান সম্পর্কে একটি ভাল বোঝা প্রয়োজন তবে আমার দৃষ্টিতে এটি যথেষ্ট নয়। পরিসংখ্যান বনাম অন্যান্য দক্ষতার গভীরতা / অসুবিধা সম্পর্কে, আমি যুক্তি দিয়ে বলব যে কম্পিউটার বিজ্ঞানের দিক সম্পর্কে একটি ভাল বোঝা অর্জন যতটা গভীর / কঠিন, যদি বেশি না হয়। এছাড়াও, সেই এস.ই. সম্পর্কিত প্রশ্নাবলীর বিষয়ে, আপনি যে কোনও এসই (এই সহ) এর উপর এই ধরণের প্রশ্নগুলি খুঁজে পান - এর অর্থ কিছু লোক বোঝা ছাড়া সহজ সমাধান চায় তা ছাড়া এর অর্থ কিছুই নয়।
বিটওয়াইজ

6
এই "ডেটা সায়েন্স বনাম পরিসংখ্যান" বিতর্কগুলির মধ্যে যে বিষয়টি ক্লান্তিকর হয়ে ওঠে তা হ'ল তথ্য বিজ্ঞানীরা পরিসংখ্যানবিদদের একটি উন্নত জাতের মতো the আসল বিষয়টি হ'ল যেহেতু আপনার জ্ঞানের প্রশস্ততা গভীরতা হ্রাস পাচ্ছে এবং যারা "তথ্য বিজ্ঞানী" হওয়ার জন্য প্রয়োজনীয় সমস্ত কাজেই নিখুঁত চেয়ে ভাল, তাদের আমি এই বিষয়গুলির বেশিরভাগ জ্ঞানের ধারণা করতে পারি বেশ পৃষ্ঠপোষক। সাধারণভাবে এটি যে কোনও ডোমেনের বিশেষজ্ঞ হওয়ার কাছাকাছি আসা খুব কঠিন, লোকেরা আশা করে যে এই পৌরাণিক তথ্য বিজ্ঞানীরা আয়ত্ত করেছেন।
dsaxton

7

সমস্ত দুর্দান্ত উত্তর, তবে আমার কাজের শিকারের অভিজ্ঞতায় আমি উল্লেখ করেছি যে "ডেটা সায়েন্টিস্ট" শব্দটি আমার সাথে যোগাযোগ করা নিয়োগকারীদের মনে "জুনিয়র ডেটা অ্যানালিস্ট" দ্বারা বিভ্রান্ত হয়েছে। এভাবে বেশ কয়েক বছর আগে যে পরিসংখ্যানের অভিজ্ঞতা নেই তাদের পরিচয় এক এক মেয়াদী কোর্স ছাড়া কয়েক বছর আগে তারা এখন নিজেদের ডেটা বিজ্ঞানী বলে। একজন কম্পিউটার বিজ্ঞানের পটভূমি এবং ডেটা বিশ্লেষক হিসাবে অভিজ্ঞতার বছর হিসাবে, আমি আমার ক্যারিয়ারের পরে এই পরিসংখ্যান থেকে পিএইচডি করেছি এই ভেবে যে এটি আমাকে ভিড় থেকে দাঁড়াতে সহায়তা করবে, আমি নিজেকে "অপ্রত্যাশিতভাবে" বিশাল বিশাল ভিড়ের মধ্যে পেয়েছি "ডেটা বিজ্ঞানীদের" "। আমি মনে করি যে আমি "পরিসংখ্যানবিদ" এ ফিরে যেতে পারি!


5
আমি মূলত একই জিনিস দেখতে। যে কোনও কাজ যা ডেটা বা কিছু বিশ্লেষণ সহ কিছু কাজের অনুরোধ করে তাকে "ডেটা সায়েন্স" বলা হয়। আমি মনে করি অর্থের ক্ষেত্রে "কোয়ান্ট" এর সাথে খুব একই রকম ঘটনা ঘটেছে, যেখানে যে কেউ ডেটা নিয়ে কিছু কাজ করেছিল তারা নিজেকে "কোয়ান্ট" বলে ডাকে।
আকাওয়াল

6

আমি একজন জুনিয়র কর্মচারী, তবে আমার কাজের শিরোনাম "ডেটা সায়েন্টিস্ট"। আমি মনে করি বিটওয়াইজের উত্তরটি আমার কী করাতে হয়েছিল তার একটি যথাযথ বিবরণ, তবে আমি আমার কাজের প্রতি দিনের অভিজ্ঞতার ভিত্তিতে আরও একটি পয়েন্ট যুক্ত করতে চাই:

Data ScienceStatistics,
StatisticsData Science.

বিজ্ঞান তদন্তের প্রক্রিয়া। যখন ডেটা হল সেই তদন্তটি করা হচ্ছে, তখন ডেটা সায়েন্স ঘটছে। এর অর্থ এই নয় যে যে যারা ডেটা নিয়ে পরীক্ষা-নিরীক্ষা করেন বা গবেষণা করেন তারা অগত্যা ডেটা বিজ্ঞানী, একইভাবে যে তারের সাথে পরীক্ষা-নিরীক্ষা করেন বা গবেষণা করেন এমন সকলেই অগত্যা বৈদ্যুতিক প্রকৌশলী নন। তবে এর অর্থ এই নয় যে একজন ব্যক্তি একজন পেশাদার "ডেটা ইনকোয়ারার" হওয়ার জন্য পর্যাপ্ত প্রশিক্ষণ অর্জন করতে পারে যেভাবে একজন পেশাদার ইলেকট্রিশিয়ান হওয়ার জন্য পর্যাপ্ত প্রশিক্ষণ অর্জন করতে পারে। এই প্রশিক্ষণটি বিটওয়াইসের উত্তরের পয়েন্টগুলির সাথে কমবেশি গঠিত, যার মধ্যে পরিসংখ্যান একটি উপাদান তবে সম্পূর্ণ নয়।

পাইওটারের উত্তরটিও আমার যা করা দরকার তা সবই একটি চমৎকার সারসংক্ষেপ যা আমি জানতাম যে একটি নির্দিষ্ট সপ্তাহে কীভাবে করা উচিত। আমার কাজ এখন পর্যন্ত বেশিরভাগ প্রাক্তন কর্মচারীদের দ্বারা ক্ষতিগুলি পূর্ন করতে সহায়তা করেছে যারা ভেন চিত্রের "ড্যাঞ্জার অঞ্চল" অংশের অন্তর্ভুক্ত ছিল।


2
+1 টি। আমি মনে করি যারা এই তথ্যগুলিতে "ডেটা বিজ্ঞানী" হিসাবে নিযুক্ত আছেন তাদের কাছ থেকে শুনে এটি খুব মূল্যবান।
অ্যামিবা

(+1) @ আমেবা আমি আপনার অনুভূতির সাথে 100% সম্মত
রাস্টিস্ট্যাটাস্টিকান

8
Data ScienceStatisticsStatisticsData ScienceStatisticsData Science

@ কেভম্যান আমি অবশ্যই একমত।
রাস্টিস্ট্যাটিস্টিয়ান

1
StatisticsData ScienceStatisticsData ScienceData Science

3

আমি সম্প্রতি ক্যারিয়ার হিসাবে ডেটা সায়েন্সে আগ্রহী হয়েছি এবং আমি যে অসংখ্য পরিসংখ্যান কোর্স নিয়েছি (এবং উপভোগ করেছি!) এর তুলনায় আমি ডেটা সায়েন্স জব সম্পর্কে যা শিখেছি তা ভেবে আমি ডেটা বিজ্ঞানীদের হিসাবে ভাবতে শুরু করেছিলাম কম্পিউটার বিজ্ঞানীরা যারা তাদের তথ্যের দিকে মনোনিবেশ করেছেন। বিশেষত, আমি নিম্নলিখিত মূল পার্থক্যগুলি লক্ষ্য করেছি। উল্লেখ্য যে পার্থক্য মেজাজ প্রদর্শিত হয়। নিম্নলিখিতটি কেবল আমার বিষয়গত ছাপগুলি প্রতিফলিত করে এবং আমি সাধারণতার দাবি করি না। শুধু আমার ছাপ!

  1. পরিসংখ্যানগুলিতে, আপনি বিতরণ, সম্ভাবনাগুলি এবং অনুমানমূলক পদ্ধতিগুলি (হাইপোথিসিস টেস্টগুলি কীভাবে করবেন, যা অন্তর্নিহিত বিতরণগুলি ইত্যাদি) সম্পর্কে খুব যত্নশীল। আমি যা বুঝতে পারি তা থেকে ডেটা সায়েন্স প্রায়শই ভবিষ্যদ্বাণী সম্পর্কে না, এবং অনুমানমূলক বিবৃতি সম্পর্কে উদ্বেগ কিছুটা হলেও কম্পিউটার বিজ্ঞান যেমন ক্রস-বৈধকরণের পদ্ধতি দ্বারা শোষিত হয়।

  2. পরিসংখ্যানের পাঠ্যক্রমগুলিতে, আমি প্রায়শই কেবল আমার নিজের ডেটা তৈরি করি বা কিছু প্রস্তুত তৈরি ডেটা ব্যবহার করি যা পরিবর্তে পরিষ্কার ফর্ম্যাটে পাওয়া যায়। এর অর্থ এটি একটি দুর্দান্ত আয়তক্ষেত্রাকার বিন্যাসে রয়েছে, কিছু এক্সেল স্প্রেডশিট, বা এর মতো কিছু যা র‍্যামের সাথে পুরোপুরি ফিট করে। ডেটা সাফাই অবশ্যই জড়িত, তবে আমি কখনই ওয়েব থেকে ডেটা "আহরণের" সাথে মোকাবিলা করতে পারি নি, এমন ডেটাবেসগুলি থেকে বেরিয়ে আসি যা র‌্যামের সাথে খাপ খায় না এমন পরিমাণের ডেটা রাখতে পারে। আমার ধারণাটি এই যে কম্পিউটেশনাল দিকটি ডেটা সায়েন্সে অনেক বেশি প্রাধান্য পায়।

  3. সাধারণত এটি পরিসংখ্যানবিদরা সাধারণত পরিসংখ্যান সংক্রান্ত কাজগুলিতে কী করেন সে সম্পর্কে আমার অজ্ঞতা প্রতিফলিত করে, তবে ডেটা সায়েন্সের আগে আমি কখনও বৃহত্তর প্রোডাক্টে মডেল তৈরি করার বিষয়ে ভাবি নি। একটি বিশ্লেষণ করার দরকার ছিল, একটি পরিসংখ্যানগত সমস্যা সমাধান করা উচিত, কিছু প্যারামিটার অনুমান করা উচিত এবং এটি এটি। ডেটা সায়েন্সে, মনে হয় প্রায়শই (যদিও সর্বদা নয়) ভবিষ্যদ্বাণীপূর্ণ মডেলগুলি একটি বৃহত্তর কিছুতে তৈরি হয়। উদাহরণস্বরূপ, আপনি কোথাও ক্লিক করেছেন এবং মিলিসেকেন্ডের মধ্যে, ভবিষ্যদ্বাণীমূলক অ্যালগরিদম সিদ্ধান্ত নিয়েছে যে ফলাফল হিসাবে কী দেখানো হচ্ছে। সুতরাং, পরিসংখ্যানগুলিতে থাকাকালীন আমি সর্বদা ভাবতাম "আমরা কী প্যারামিটারটি অনুমান করতে পারি, এবং কীভাবে আমরা তা মার্জিতভাবে করব", মনে হয় যে তথ্য বিজ্ঞানে ফোকাসটি "আমরা কী ভবিষ্যদ্বাণী করতে পারি যে কোনও ডেটা প্রোডাক্টে সম্ভাব্যভাবে কার্যকর" ।

আবার, উপরেরগুলি একটি সাধারণ সংজ্ঞা দেওয়ার চেষ্টা করে না। আমি নিজেকে যে প্রধান পার্থক্যগুলি অনুধাবন করেছি তা কেবল ইঙ্গিত করছি। আমি এখনও তথ্য বিজ্ঞানে নেই, তবে আমি আশা করি পরের বছরে ট্রানজিশন হবে। এই অর্থে আমার দুটি সেন্ট এখানে নুনের দানা দিয়ে নিয়ে যান।


2

আমি বলি একটি ডেটা সায়েন্টিস্ট এমন একটি ভূমিকা যেখানে কোনও ব্যক্তি ব্যবসায়ের জন্য মানব-পঠনযোগ্য ফলাফল তৈরি করে, ফলাফলগুলি পরিসংখ্যানগতভাবে শক্ত (তাৎপর্যপূর্ণ) করার পদ্ধতিগুলি ব্যবহার করে।

যদি এই সংজ্ঞাটির কোনও অংশ অনুসরণ না করা হয় তবে আমরা হয় বিকাশকারী, একজন সত্যিকারের বিজ্ঞানী / পরিসংখ্যানবিদ, বা ডেটা ইঞ্জিনিয়ার সম্পর্কে কথা বলি।


2

আমি সবসময় বিষয়টির মূল অংশটি কাটাতে পছন্দ করি।

statistics - science + some computer stuff + hype = data science

1
এটি "মেশিন লার্নিং" -র মতামতটি তৈরি করেছিলাম, যা আমি "সফটওয়্যারটির টুকরোটি কীভাবে এটি পরিচালনা করে তা কীভাবে পরিচালনা করতে শেখা" হিসাবে আবদ্ধ করে ফেলেছি (অবশ্যই অন্যায্য, তবে আমরা অনেকগুলি "মেশিন লার্নিং" দেখি স্কুল থেকে বেরিয়ে আসা লোকেরা যারা বিভিন্ন ধরণের নিউরাল জালগুলির
সুরের

1

বিশ্লেষণাত্মক জটিল সমস্যা সমাধানের জন্য ডেটা সায়েন্স হ'ল ডেটা ইনফারেন্স, অ্যালগরিদম ডেভলপমেন্ট এবং প্রযুক্তির একটি বহুমাত্রিক সংমিশ্রণ। তবে ডেটা সায়েন্টিস্টের অভাবের কারণে ডেটা সায়েন্সের ক্যারিয়ার সত্যিই অসংখ্য সুযোগ তৈরি করতে পারে। যাইহোক, সংস্থাগুলি এসএএস, ডেটা সায়েন্স কাউন্সিল অফ আমেরিকা (ডিএএসসিএ), হর্টন ওয়ার্কস ইত্যাদির শংসিত পেশাদারদের সন্ধান করছে আশা করি এটি একটি ভাল তথ্য!


1

পাইথন, মাইএসকিউএল এবং জাভা বিকাশে ডেটা বিজ্ঞানীদের খুব দক্ষ দক্ষতা রয়েছে।

তাদের কাছে বিশ্লেষণাত্মক কার্যকারিতা সম্পর্কে খুব স্পষ্ট ধারণা রয়েছে, গণিত, পরিসংখ্যান, ডেটা মাইনিং, ভবিষ্যদ্বাণীমূলক বিশ্লেষণ দক্ষতা এবং পাইথন এবং আর এর মতো কোডিং ভাষাগুলির সম্পর্কে তাদের খুব ভাল জ্ঞান রয়েছে have

এই মুহূর্তে প্রচুর ডেটা বিজ্ঞানী তাদের পিএইচডি করেছেন বা তাদের মাস্টার্স ডিগ্রিটি গবেষণা অনুযায়ী আসলে প্রায় 8% কেবলমাত্র স্নাতক ডিগ্রি অর্জন করে তাই এটি আরও গভীরতর।

ডেটা ভিত্তিক সিদ্ধান্ত নেওয়ার পরিসংখ্যানের মডেলগুলি তৈরি করা। প্রতিটি সিদ্ধান্ত কঠোর হতে পারে, উদাহরণস্বরূপ একটি পৃষ্ঠা রেন্ডারিং বা নরম থেকে ব্লক করুন, উদাহরণস্বরূপ কোনও পৃষ্ঠার দূষিততার জন্য একটি স্কোর বরাদ্দ করুন, যা নিম্নমুখী সিস্টেম বা মানব দ্বারা ব্যবহৃত হয়।

কার্যকারিতা পরীক্ষা-নিরীক্ষা পরিচালনা করা যা কোনও পর্যবেক্ষণের ঘটনার মূল কারণকে দায়ী করার চেষ্টা করে। এ / বি পরীক্ষা-নিরীক্ষার নকশা করে বা এ / বি পরীক্ষায় সমস্যাটির ক্ষেত্রে মহামারী সংক্রান্ত পদ্ধতির প্রয়োগ সম্ভব না হলে এটি করা যেতে পারে, যেমন @ রুবিন কার্যকারিতা মডেল

নতুন পণ্য বা বৈশিষ্ট্যগুলি সনাক্ত করা যা ডেটার মান আনলক করা থেকে আসে; ডেটা মান সম্পর্কে একটি চিন্তা নেতা। এর একটি ভাল উদাহরণ হল পণ্য প্রস্তাবনা বৈশিষ্ট্য যা অ্যামাজন প্রথমে একটি শ্রোতা দর্শকদের জন্য উপলব্ধ করেছিল।


1
ভাল, না। আপনি যতটা তথ্য বিজ্ঞানী চাকরির চেইনে উঠতে পারবেন ততই আমি উচ্চ, এবং আমি জাভা মোটেও জানি না বা পাইথনে আমি মোটেও দক্ষ নই, এবং আমার মাইএসকিউএল দক্ষতা জেনেরিক মানের সেরা। আমার গ্রুপে আমাদের মধ্যে আরও দু'জন লোক রয়েছেন যারা আর্টকে বেশি সংখ্যক পাইথন জানেন, আর তারা কেবল জাভা জানেন তবে তিনি মূলত আর এবং সি / সি ++ তে কোড করেন (আমার মতো।) তিনজন পাইথন জানেন তবে সত্যিকার অর্থে কোনটি জানেন না নিম্ন স্তরের ভাষা। আমি পাইথন ভি। আর শিখা যুদ্ধ, বা জাভা বনাম সি / সি ++ এ যেতে চাই না, তবে এটি কোনওভাবেই নয় যে আপনার প্রোগ্রামিং সম্পর্কিত কোনও দক্ষতার তালিকা প্রয়োজন necessary
jboman

0

আপনার প্রশ্নের উত্তর দিতে "ডেটা বিজ্ঞানী কী?" কোনও ডাটা সায়েন্টিস্ট এবং ডেটা মেকানিকের মধ্যে পার্থক্য সম্পর্কে সচেতন হওয়া সচেতন হতে পারে http://sites.temple.edu/deepstat/data-scientist-and-data-mechanic/ তে উল্লিখিত


1
এটির সম্পূর্ণ উত্তর হওয়ার জন্য, দয়া করে আপনার উত্তরের নিবন্ধের মূল বিষয়গুলি হাইলাইট করুন, যাতে ওপি এবং অন্যান্য পাঠকদের কী মূল বিষয়গুলি সরবরাহ করা যায়।
গ্রিনপার্কার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.