পরিসংখ্যানগুলিতে সম্প্রতি আমার পিএইচডি প্রোগ্রাম থেকে স্নাতক হওয়ার পরে, আমি গত কয়েক মাস ধরে পরিসংখ্যানের ক্ষেত্রে কাজ সন্ধান করতে শুরু করেছিলাম। আমি বিবেচিত প্রায় প্রতিটি সংস্থা " ডেটা সায়েন্টিস্ট " এর একটি কাজের শিরোনাম সহ একটি চাকরী পোস্ট করে । প্রকৃতপক্ষে, মনে হয়েছিল স্ট্যাটিস্টিকাল সায়েন্টিস্ট বা স্ট্যাটিসটিক্যান্সের কাজের শিরোনাম দেখার দিনগুলি অনেক দিন কেটে গেল । একজন ডেটা বিজ্ঞানী হয়ে কি সত্যিই প্রতিস্থাপন করেছিলেন যা একটি পরিসংখ্যানবিদ হলেন বা শিরোনামের প্রতিশব্দ ছিল যা আমি ভাবছিলাম?
ঠিক আছে, চাকরীর ক্ষেত্রে বেশিরভাগ যোগ্যতা এমন বিষয়গুলির মতো অনুভূত হয়েছিল যা পরিসংখ্যানবিদদের শিরোনামে যোগ্যতা অর্জন করবে। বেশিরভাগ চাকরি পরিসংখ্যানগুলিতে পিএইচডি চেয়েছিল ( ), সর্বাধিক প্রয়োজনীয় বোঝাপড়া পরীক্ষামূলক নকশা ( ), লিনিয়ার রিগ্রেশন এবং আনোভা ( ), সাধারণীকরণীয় রৈখিক মডেল ( ), এবং অন্যান্য বহুবিধ পদ্ধতি যেমন পিসিএ ( ) , পাশাপাশি আর বা এসএএস ( ) এর মতো একটি পরিসংখ্যানগত কম্পিউটিং পরিবেশে জ্ঞান । ডেটা সায়েন্টিস্টের মতো মনে হয় স্ট্যাটিস্টিশিয়ানদের পক্ষে কেবল একটি কোডের নাম।✓ ✓ ✓ ✓ ✓
যাইহোক, প্রতিটি সাক্ষাত্কারে আমি এই প্রশ্নটি শুরু করেছিলাম: "সুতরাং আপনি কি মেশিন লার্নিং অ্যালগরিদমগুলির সাথে পরিচিত?" প্রায়শই না, আমি নিজেকে বড় ডেটা, উচ্চ পারফরম্যান্স কম্পিউটিং এবং নিউরাল নেটওয়ার্কগুলি সম্পর্কিত বিষয়গুলি, কার্ট, সমর্থন ভেক্টর মেশিন, গাছ বাড়ানো, নিরীক্ষণযোগ্য মডেল ইত্যাদির বিষয়ে প্রশ্নের উত্তর এবং উত্তর দিতে পেরেছি। নিশ্চিত আমি নিজেকে নিশ্চিত করেছিলাম যে এগুলি সবই ছিল হৃদয়ের পরিসংখ্যানগত প্রশ্নগুলি, তবে প্রতিটি সাক্ষাত্কারের শেষে আমি সাহায্য করতে পারিনি তবে এমন অনুভূতি ছেড়ে যাচ্ছিলাম যে ডেটা বিজ্ঞানী কী তা সম্পর্কে আমি কম-বেশি জানি।
আমি একজন পরিসংখ্যানবিদ, তবে আমি কি ডেটা বিজ্ঞানী? আমি বৈজ্ঞানিক সমস্যা নিয়ে কাজ করি তাই আমাকে অবশ্যই একজন বিজ্ঞানী হতে হবে! এবং আমি ডেটা নিয়েও কাজ করি, সুতরাং অবশ্যই আমাকে ডেটা বিজ্ঞানী হতে হবে! এবং উইকিপিডিয়া অনুসারে, বেশিরভাগ শিক্ষাবিদ আমার সাথে একমত হবেন ( https://en.wikedia.org/wiki/Data_s विज्ञान , ইত্যাদি)
যদিও "পরিবেশ বিজ্ঞান" শব্দটি ব্যবহারটি ব্যবসায়ের পরিবেশে বিস্ফোরিত হয়েছে, অনেক শিক্ষাবিদ এবং সাংবাদিক ডেটা বিজ্ঞান এবং পরিসংখ্যানের মধ্যে কোনও পার্থক্য দেখেন না।
তবে যদি আমি কোনও ডেটা বিজ্ঞানীর অবস্থানের জন্য এই সমস্ত চাকরীর সাক্ষাত্কারটি চালিয়ে যাচ্ছি তবে কেন এমন মনে হচ্ছে যে তারা কখনও আমাকে পরিসংখ্যানমূলক প্রশ্ন জিজ্ঞাসা করছে না?
ঠিক আছে আমার শেষ সাক্ষাত্কারের পরে আমি চেয়েছিলাম যে কোনও ভাল বিজ্ঞানী করুক এবং আমি এই সমস্যাটি সমাধানের জন্য ডেটা চেয়েছিলাম (আরে, আমি সর্বোপরি ডেটা বিজ্ঞানী)। যাইহোক, পরে অনেকগুলি গুগল অনুসন্ধান করার পরে, আমি ঠিক সেখানেই শেষ হয়ে গেলাম যেখানে আমি অনুভব করতে শুরু করলাম যেন আমি আবার কোনও তথ্য বিজ্ঞানী কী তার সংজ্ঞা নিয়ে ঝাঁপিয়ে পড়ছি। আমি জানি না যে কোনও তথ্য বিজ্ঞানী ঠিক কীহেতু এর অনেক সংজ্ঞা ছিল, ( http://blog.udacity.com/2014/11/data-sज्ञान-job-skills.html , http: // www -01.ibm.com/software/data/infosphere/data-scientist/ ) তবে দেখে মনে হয়েছিল সবাই আমাকে বলছে আমি এক হতে চাই:
- https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/
- http://mashable.com/2014/12/25/data-scientist/#jjgsyhcERZqL
- ইত্যাদি .... তালিকা চলে।
ঠিক আছে, দিন শেষে, আমি যা বুঝতে পেরেছিলাম "একটি তথ্য বিজ্ঞানী কী" উত্তর দেওয়া খুব কঠিন প্রশ্ন। হেক, আমস্টাতে পুরো দুটি মাস ছিল যেখানে তারা এই প্রশ্নের উত্তর দেওয়ার জন্য সময় ব্যয় করেছিল:
- http://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/
- http://magazine.amstat.org/blog/2015/11/01/statnews2015/
আপাতত, ডেটা বিজ্ঞানী হওয়ার জন্য আমাকে সেক্সি পরিসংখ্যানবিদ হতে হবে তবে আশা করি ক্রস বৈধতাযুক্ত সম্প্রদায়টি কিছুটা আলোকপাত করতে সক্ষম হতে পারে এবং ডেটা বিজ্ঞানী হওয়ার অর্থ কী তা বুঝতে আমাকে সহায়তা করতে পারে। সব পরিসংখ্যানবিদরা কি ডেটা বিজ্ঞানী নন?
(সম্পাদনা / আপডেট)
আমি ভেবেছিলাম এটি কথোপকথনটি মশালায়। মাইক্রোসফ্ট একটি ডেটা সায়েন্টিস্ট খুঁজছেন এমন একটি চাকরির বিষয়ে আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের কাছ থেকে আমি কেবল একটি ইমেল পেয়েছি। এখানে লিঙ্কটি রয়েছে: ডেটা সায়েন্টিস্ট পজিশন । আমি মনে করি এটি আকর্ষণীয় কারণ পজিশনের ভূমিকাটি আমরা যে নির্দিষ্ট বৈশিষ্ট্যের সাথে কথা বলেছি তার উপর নির্ভর করে তবে আমি মনে করি যে তাদের মধ্যে অনেকেরই পরিসংখ্যানগুলিতে খুব কঠোর পটভূমি প্রয়োজন, পাশাপাশি নীচে পোস্ট করা অনেকগুলি উত্তরগুলির বিপরীতে। লিঙ্কটি মারা যাওয়ার ক্ষেত্রে, মাইক্রোসফ্ট একটি ডেটা বিজ্ঞানীর কাছে যে গুণাবলীর সন্ধান করছে সেগুলি এখানে:
মূল কাজের প্রয়োজনীয়তা এবং দক্ষতা:
অ্যানালিটিক্স ব্যবহার করে ব্যবসায় ডোমেনের অভিজ্ঞতা
- জটিল ব্যবসায়ের সমস্যা এবং তাদের সমাধানগুলি বড় আকারের রিয়েল-ওয়ার্ল্ড বিজনেস ডেটা সেটগুলিতে উন্নত বিশ্লেষণগুলি ব্যবহার করে কল্পনা করার জন্য সমালোচনামূলক চিন্তা দক্ষতার ব্যবহারে বেশ কয়েকটি প্রাসঙ্গিক ব্যবসায় ডোমেনের অভিজ্ঞতা থাকতে হবে
- প্রার্থীকে অবশ্যই বিশ্লেষণাত্মক প্রকল্পগুলি স্বতঃস্ফূর্তভাবে চালাতে সক্ষম হবে এবং আমাদের অভ্যন্তরীণ ক্লায়েন্টদের অনুসন্ধানগুলি বুঝতে এবং তাদের ব্যবসায়ের সুবিধার্থে এটিকে ক্রিয়ায় অনুবাদ করতে সহায়তা করবে।
ভবিষ্যদ্বাণীপূর্ণ মডেলিং
- ভবিষ্যদ্বাণীপূর্ণ মডেলিংয়ে শিল্প জুড়ে অভিজ্ঞতা
- ব্যবসায়ের সমস্যা সংজ্ঞা এবং ক্লায়েন্টের সাথে ধারণাগত মডেলিং গুরুত্বপূর্ণ সম্পর্কগুলি নির্ধারণ করতে এবং সিস্টেমের ক্ষেত্রটি সংজ্ঞায়িত করতে
পরিসংখ্যান / অর্থনীতি
- অবিচ্ছিন্ন এবং শ্রেণিবদ্ধ ডেটার জন্য অনুসন্ধানের ডেটা বিশ্লেষণ
- প্রয়োজন অনুসারে এন্টারপ্রাইজ এবং ভোক্তাদের আচরণ, উত্পাদন ব্যয়, ফ্যাক্টরের চাহিদা, স্বতন্ত্র পছন্দ এবং অন্যান্য প্রযুক্তির সম্পর্কের জন্য কাঠামোগত মডেল সমীকরণগুলির নির্দিষ্টকরণ এবং অনুমান
- অবিচ্ছিন্ন এবং বিভাগীয় ডেটা বিশ্লেষণের জন্য উন্নত পরিসংখ্যান কৌশল
- সময় ধারাবাহিক বিশ্লেষণ এবং পূর্বাভাস মডেলগুলির বাস্তবায়ন
- একাধিক ভেরিয়েবল সমস্যা নিয়ে কাজ করার জ্ঞান এবং অভিজ্ঞতা
- মডেল নির্ভুলতা মূল্যায়ন এবং ডায়াগনস্টিক পরীক্ষা পরিচালনা করার ক্ষমতা
- পরিসংখ্যান বা অর্থনৈতিক মডেলগুলি ব্যাখ্যা করার ক্ষমতা
- বিচ্ছিন্ন ইভেন্ট সিমুলেশন এবং গতিশীল সিমুলেশন মডেল তৈরির জ্ঞান এবং অভিজ্ঞতা
ডাটা ব্যাবস্থাপনা
- ডেটা ট্রান্সফারেশনের জন্য টি-এসকিউএল এবং অ্যানালিটিক্স ব্যবহার এবং খুব বড় রিয়েল-ওয়ার্ল্ড ডেটা সেটগুলির জন্য অনুসন্ধানের ডেটা বিশ্লেষণ কৌশল প্রয়োগের সাথে পরিচিতি
- ডেটা রিডানডেন্সি, ডেটা নির্ভুলতা, অস্বাভাবিক বা চরম মান, ডেটা ইন্টারঅ্যাকশন এবং অনুপস্থিত মান সহ ডেটা অখণ্ডতার প্রতি মনোযোগ।
যোগাযোগ এবং সহযোগিতা দক্ষতা
- স্বতন্ত্রভাবে কাজ করুন এবং ভার্চুয়াল প্রকল্প দলের সাথে কাজ করতে সক্ষম হোন যা ব্যবসায়ের সমস্যার চ্যালেঞ্জিংয়ের উদ্ভাবনী সমাধানগুলি নিয়ে গবেষণা করবে
- অংশীদারদের সাথে সহযোগিতা করুন, সমালোচনামূলক চিন্তাভাবনা দক্ষতা প্রয়োগ করুন এবং বিশ্লেষণাত্মক প্রকল্পগুলি শেষ-শেষ পর্যন্ত ড্রাইভ করুন
- উচ্চতর যোগাযোগ দক্ষতা, মৌখিক এবং লিখিত উভয়ই
- বিশ্লেষকদের এমন একটি ফর্মের ফলাফলের ভিজ্যুয়ালাইজেশন যা স্টেকহোল্ডারদের বিবিধ সেট দ্বারা গ্রহণযোগ্য
সফ্টওয়্যার প্যাকেজ
- উন্নত পরিসংখ্যান / একনোমেট্রিক সফ্টওয়্যার প্যাকেজ: পাইথন, আর, জেএমপি, এসএএস, মতামত, এসএএস এন্টারপ্রাইজ খনি
- ডেটা এক্সপ্লোরেশন, ভিজ্যুয়ালাইজেশন এবং পরিচালনা: টি-এসকিউএল, এক্সেল, পাওয়ারবিআই এবং সমতুল্য সরঞ্জাম
যোগ্যতা:
- নূন্যতম 5+ বছরের সম্পর্কিত অভিজ্ঞতার প্রয়োজন
- পরিমাণগত ক্ষেত্রে স্নাতকোত্তর ডিগ্রি আকাঙ্ক্ষিত।