আপনি কীভাবে কাজের প্রত্যাশা পরিচালনা করবেন?

22

ডেটা সায়েন্স, মেশিন লার্নিং এবং চারপাশের সমস্ত সাফল্যের গল্পগুলির চারপাশের সমস্ত হুপলা সহ, অনেকগুলি ন্যায়সঙ্গত, পাশাপাশি অতিমাত্রায় বিভক্ত, ডেটা বিজ্ঞানী এবং তাদের ভবিষ্যদ্বাণীপূর্ণ মডেলগুলির কাছ থেকে প্রত্যাশা রয়েছে।

পরিসংখ্যানবিদ, মেশিন লার্নিং বিশেষজ্ঞ এবং ডেটা সায়েন্টিস্টদের অনুশীলন করার ক্ষেত্রে আমার প্রশ্নটি - আপনি কীভাবে আপনার সংস্থার ব্যবসায়ীদের কাছ থেকে প্রত্যাশাগুলি পরিচালনা করবেন, বিশেষত মডেলগুলির ভবিষ্যদ্বাণীপূর্ণ নির্ভুলতার সাথে? এটিকে তুচ্ছভাবে বলতে গেলে, যদি আপনার সেরা মডেলটি কেবল 90% নির্ভুলতা অর্জন করতে পারে, এবং উচ্চতর পরিচালন 99% এর চেয়ে কম কিছুই প্রত্যাশা করে, আপনি কীভাবে এই পরিস্থিতিতে পরিস্থিতি পরিচালনা করবেন?

performance accuracy

— স্নায়ুর
সূত্র

1

সুন্দর প্রশ্ন! তবে আমার মনে করা একটি সম্প্রদায়ের উইকি হওয়া উচিত

— আলেক্সি গ্রিগোরভ

1

দুর্দান্ত প্রশ্ন। সেখানে এসেছেন, করেছেন (এবং করছেন): ডি

— ডাউনি 33

11

যুক্তিযুক্ত ব্যবসায়ের লোকেরা নির্ভুলতার জন্য অর্থ প্রদান করে না, তারা উভয়কেই প্রদান করে

লাভজনক প্রক্রিয়াতে অর্থ সাশ্রয় করুন (এর মাধ্যমে এটিকে আরও লাভজনক করা হবে) বা এর মাধ্যমে
নতুন অর্থ তৈরি করা (নতুন লাভজনক প্রক্রিয়া তৈরি করা)।

সুতরাং যে কোনও প্রকল্প হাতে নেওয়া হয়েছে তার মধ্যে এটি প্রতিফলিত হওয়া উচিত। প্রথম ধাপটি সর্বদা বোঝা যায় যে আপনি যে দুটি প্রক্রিয়া নিয়ে কাজ করছেন তার মধ্যে এবং আপনার কীভাবে কীভাবে তা করা যায় তার বিশদটি মাথায় রেখে আপনি কীভাবে তা অর্জন করতে পারেন তার একটি স্পষ্ট ধারণা থাকা উচিত।

আপনি যদি কোনও প্রক্রিয়াটির যথার্থতা উন্নতি করতে পারেন তবে আপনি সম্ভবত ফার্মটির জন্য অর্থোপার্জন করতে পারেন এবং ব্যবসায়িক লোকেরা আপনার অগ্রগতিতে বিনিয়োগ করবে। একজন ব্যবসায়িক ব্যক্তি যদি 99 শতাংশ নির্ভুলতার জন্য জোর দেওয়ার এবং 90 শতাংশ প্রত্যাখ্যান করার একমাত্র যুক্তিযুক্ত কারণ হ'ল যদি তাদের যদি ইতিমধ্যে এটি করার একটি উপায় থাকে যা 90 শতাংশের চেয়ে ভাল ছিল। যদি এটি হয় তবে তারা অবশ্যই তাদের পদে ন্যায়সঙ্গত।

আপনি যে প্রকল্পগুলিতে কাজ করছেন সেগুলির ব্যবসায়িক বিষয় বোঝা এবং উপস্থাপন করা যেভাবে ব্যবসায়ীরা বোঝেন যে কোনও ইঞ্জিনিয়ারের পরিপক্ক প্রক্রিয়ার অংশ of এটি ডেটা সায়েন্সের পক্ষে একেবারেই অনন্য নয়, যদিও ডেটা সায়েন্সের কিছু অনন্য দিক রয়েছে (যেমন স্বল্প পরিপক্কতা তবে কমপক্ষে সেরেন্ডিপিটি আবিষ্কারের উচ্চতর সম্ভাবনা - কমপক্ষে আজকের পরিবেশে।

ডেটা সায়েন্সের নিকটে থাকা একটি প্রাসঙ্গিক প্রক্রিয়া যা এই পদক্ষেপটি সুস্পষ্ট করে তুলেছে এখানে পাওয়া যাবে: https://en.wikedia.org/wiki/Cross_Industry_S স্ট্যান্ডার্ড_প্রসেস_ডোটা_মিনিং

তবে বেশিরভাগ এন্টারপ্রাইজ আর্কিটেকচার ফ্রেমওয়ার্ক একইভাবে প্রযোজ্য।

— মাইক ওয়াইজ
সূত্র

1

সুন্দরভাবে সম্পন্ন. আপনার উত্তর ধরণের বাস্তবতা থেকে প্রত্যাশা সীমাবদ্ধ করে। বলিহারি!

— শিরোনামহীন প্রোগ্রামার

অদ্ভুতভাবে এখানে upvote আমার পয়েন্টগুলিতে নিবন্ধন করেনি।

— মাইক ওয়াইজ

10

প্রতিযোগিতামূলক অংশগুলি সংগ্রহ করুন। একটি অত্যাধুনিক রাষ্ট্রটি চেষ্টা করুন এবং নির্ধারণ করুন এবং দেখুন আপনার মডেলগুলি কীভাবে এর সাথে তুলনা করে। এটি আপনার দল কত দিন এটিতে কাজ করছে তার উপরও এটি নির্ভর করে। বিজ্ঞান-চালিত মডেলগুলি স্থিতিশীলভাবে তৈরি হয় না, এগুলি গতিশীলভাবে বিকাশ করে কারণ একজন ভাল বিজ্ঞানী সর্বদা এটির উন্নতির উপায় অনুসন্ধান করার চেষ্টা করবেন।

উচ্চ পরিচালন কর্মীদের জানা উচিত যে কোনও ডেটা বিজ্ঞানী অনেক সময় / প্রায়শই তাদের গুণাগুণ না জেনে নতুন পদ্ধতি আবিষ্কার করেন । তাদের জানা উচিত যে মেশিন শেখার কৌশলগুলি এখনই নিখুঁত মডেল তৈরি করে না। যদি তারা তা করে, এটি যাইহোক চ্যালেঞ্জিং হবে না।

তিনি কীভাবে তার ফলাফলকে ন্যায়সঙ্গত ও আলোচনা করেন এবং কীভাবে তিনি ভবিষ্যতের পরিকল্পনা করেন তার দ্বারা একজন ডেটা বিজ্ঞানীকে মূল্যায়ন করা উচিত। পরিচালনা কর্মীদের তাদের প্রত্যাশাগুলি সামলানোর জন্য একটি উপায় অবাস্তবভাবে উচ্চতর না হওয়া have

তবুও, যদি প্রসঙ্গের ক্ষেত্রে যুক্তিসঙ্গত ফলাফল প্রত্যাশিত হয় তবে এই প্রশ্নগুলি সম্পর্কে ভাবুন:

সময়ের সাথে সাথে কি ফলাফল আরও ভাল হবে?
ভবিষ্যতের প্রত্যাশা কি ইতিবাচক?
অনুরূপ সিস্টেমে (প্রতিযোগীদের কাছ থেকে) তুলনায় ফলাফলগুলি কতটা ভাল?

— lennyklb
সূত্র

5

আমি এই প্রশ্নটি পছন্দ করি কারণ এটি প্রতিটি সংস্থায় বিদ্যমান রাজনীতিতে আসে। আমার দৃষ্টিতে এবং একটি উল্লেখযোগ্য মাত্রায়, মডেল পারফরম্যান্স সম্পর্কে প্রত্যাশাগুলি org সংস্কৃতি এবং ডিগ্রির একটি ফাংশন যা কোনও সংস্থা "প্রযুক্তিগতভাবে শিক্ষিত"। আমি কী বলতে চাইছি তা পরিষ্কার করার একটি উপায় হ'ল 4 বড় "ডেটা সায়েন্স" সত্তা - গুগল, এফবি, অ্যামাজন এবং ইয়াহু - বনাম 4 টি বড় সংস্থা হোল্ডিং সত্তা - ডাব্লুপিপি, ওমিকনকন, ইন্টারব্র্যান্ড এবং পাবলিসিসের মধ্যে পার্থক্য বিবেচনা করা। গুগল, ইত্যাদি, খুব প্রযুক্তিগতভাবে শিক্ষিত। অন্যদিকে, এজেন্সিগুলি প্রযুক্তি ফোবিয়ার দিকে ঝুঁকতে পরিচিত। এর প্রমাণ কী? প্রথমত, প্রযুক্তিগতভাবে শিক্ষিত গোষ্ঠীটি প্রকৌশলী, কম্পিউটার বিজ্ঞানী, গিক এবং শক্ত প্রযুক্তিগত পটভূমির লোক দ্বারা প্রতিষ্ঠিত বা পরিচালিত হয়। প্রযুক্তি নিরক্ষর সংস্থাগুলি কে চালায়? বিপণনকারী যারা তাদের নরম যোগাযোগ এবং জনগণের দক্ষতার কারণে বিশিষ্ট হয়ে উঠেছেন। এবং কেবল এটিই নয়, এনওয়াইসি-র মধ্যে এই কয়েকটি দোকানে কাজ করার পরে আমি সাক্ষ্য দিতে পারি যে এই সংস্থাগুলি সুশৃঙ্খলভাবে "উপযুক্ত" না হিসাবে উচ্চতর প্রযুক্তিগতভাবে শিক্ষিত প্রকারকে শাস্তিমূলকভাবে শাস্তি দেয় এবং / অথবা ধাক্কা দেয়। এর পরে, তাদের সামগ্রিক (স্টক) বাজারের ক্যাপগুলি বিবেচনা করুন, প্রযুক্তি साक्षर গোষ্ঠীটি প্রায় 800 বিলিয়ন ডলার যোগ করেছে যখন প্রযুক্তি নিরক্ষর গোষ্ঠীর পরিমাণ 80 বিলিয়ন। কারিগরি সাক্ষরতার সত্তা মার্কেট ক্যাপের অন্যদের চেয়ে 10x বড়। এটি বাজারের প্রত্যাশার একটি পরিষ্কার বিবৃতি এবং নিরক্ষরদের পক্ষে এটি উচ্চ নয়। সুতরাং, বহির্মুখীকরণের মাধ্যমে, এগুলির মতো বোসোদের "ভবিষ্যদ্বাণীমূলক নির্ভুলতা" প্রত্যাশা চ্যালেঞ্জ করার জন্য আপনি কী ধরনের আশা করতে পারেন? এনওয়াইসির এই কয়েকটি দোকানে কাজ করার পরে, আমি সাক্ষ্য দিতে পারি যে এই সংস্থাগুলি সুশৃঙ্খলভাবে "উপযুক্ত" না হয়ে উচ্চতর প্রযুক্তিগতভাবে শিক্ষিত প্রকারকে শাস্তিমূলকভাবে শাস্তি দেয় এবং / অথবা ধাক্কা দেয়। এর পরে, তাদের সামগ্রিক (স্টক) বাজারের ক্যাপগুলি বিবেচনা করুন, প্রযুক্তি साक्षर গোষ্ঠীটি প্রায় 800 বিলিয়ন ডলার যোগ করেছে যখন প্রযুক্তি নিরক্ষর গোষ্ঠীর পরিমাণ 80 বিলিয়ন। কারিগরি সাক্ষরতার সত্তা মার্কেট ক্যাপের অন্যদের চেয়ে 10x বড়। এটি বাজারের প্রত্যাশার একটি পরিষ্কার বিবৃতি এবং নিরক্ষরদের পক্ষে এটি উচ্চ নয়। সুতরাং, বহির্মুখীকরণের মাধ্যমে, এগুলির মতো বোসোদের "ভবিষ্যদ্বাণীমূলক নির্ভুলতা" প্রত্যাশা চ্যালেঞ্জ করার জন্য আপনি কী ধরনের আশা করতে পারেন? এনওয়াইসির এই কয়েকটি দোকানে কাজ করার পরে, আমি সাক্ষ্য দিতে পারি যে এই সংস্থাগুলি সুশৃঙ্খলভাবে "উপযুক্ত" না হয়ে উচ্চতর প্রযুক্তিগতভাবে শিক্ষিত প্রকারকে শাস্তিমূলকভাবে শাস্তি দেয় এবং / অথবা ধাক্কা দেয়। এর পরে, তাদের সামগ্রিক (স্টক) বাজারের ক্যাপগুলি বিবেচনা করুন, প্রযুক্তি साक्षर গোষ্ঠীটি প্রায় 800 বিলিয়ন ডলার যোগ করেছে যখন প্রযুক্তি নিরক্ষর গোষ্ঠীর পরিমাণ 80 বিলিয়ন। কারিগরি সাক্ষরতার সত্তা মার্কেট ক্যাপের অন্যদের চেয়ে 10x বড়। এটি বাজারের প্রত্যাশার একটি পরিষ্কার বিবৃতি এবং নিরক্ষরদের পক্ষে এটি উচ্চ নয়। সুতরাং, বহির্মুখীকরণের মাধ্যমে, এগুলির মতো বোসোদের "ভবিষ্যদ্বাণীমূলক নির্ভুলতা" প্রত্যাশা চ্যালেঞ্জ করার জন্য আপনি কী ধরনের আশা করতে পারেন? তাদের সামগ্রিক (স্টক) বাজারের ক্যাপগুলি বিবেচনা করুন, প্রযুক্তি साक्षर গোষ্ঠী প্রায় 800 বিলিয়ন ডলার যোগ করেছে যখন প্রযুক্তি নিরক্ষর গোষ্ঠীর পরিমাণ 80 বিলিয়ন। কারিগরি সাক্ষরতার সত্তা মার্কেট ক্যাপের অন্যদের চেয়ে 10x বড়। এটি বাজারের প্রত্যাশার একটি পরিষ্কার বিবৃতি এবং নিরক্ষরদের পক্ষে এটি উচ্চ নয়। সুতরাং, বহির্মুখীকরণের মাধ্যমে, এগুলির মতো বোসোদের "ভবিষ্যদ্বাণীমূলক নির্ভুলতা" প্রত্যাশা চ্যালেঞ্জ করার জন্য আপনি কী ধরনের আশা করতে পারেন? তাদের সামগ্রিক (স্টক) বাজারের ক্যাপগুলি বিবেচনা করুন, প্রযুক্তি साक्षर গোষ্ঠী প্রায় 800 বিলিয়ন ডলার যোগ করেছে যখন প্রযুক্তি নিরক্ষর গোষ্ঠীর পরিমাণ 80 বিলিয়ন। কারিগরি সাক্ষরতার সত্তা মার্কেট ক্যাপের অন্যদের চেয়ে 10x বড়। এটি বাজারের প্রত্যাশার একটি পরিষ্কার বিবৃতি এবং নিরক্ষরদের পক্ষে এটি উচ্চ নয়। সুতরাং, বহির্মুখীকরণের মাধ্যমে, এগুলির মতো বোসোদের "ভবিষ্যদ্বাণীমূলক নির্ভুলতা" প্রত্যাশা চ্যালেঞ্জ করার জন্য আপনি কী ধরনের আশা করতে পারেন?

সুতরাং, সেই সাংস্কৃতিক ব্রেকআউট দেওয়া এবং আপনি কোথায় পড়ছেন তার উপর নির্ভর করে আপনার কম-বেশি বাস্তব প্রত্যাশা থাকা উচিত। অবশ্যই, বিভিন্ন "প্রযুক্তি নিরক্ষর" সত্তাদের ম্যানেজার থাকবে যারা জানেন তারা কী করছেন, তবে বেশিরভাগ ক্ষেত্রে, এই সত্ত্বাগুলি প্রযুক্তিগত দক্ষতায় সর্বনিম্ন সাধারণ ডিনোমিনেটরের মূর্তি দ্বারা আধিপত্য বজায় রেখেছে, যারা সবচেয়ে ভাল প্রযুক্তিগত অর্ধ-সাক্ষরতা (এবং বিপজ্জনক) বা আরও সাধারণভাবে সম্পূর্ণ অগণিত তবে এটি জানেন না। ঘটনাচক্রে, আমি একটি ছেলের পক্ষে কাজ করেছি যিনি সি-স্যুট ডেকগুলি থেকে "পরস্পর সম্পর্কযুক্ত" মত শব্দগুলি স্ক্রাব করে চেয়েছিলেন। এটি একটি চরম ঘটনা: সর্বোপরি, প্রতিটি সচিব জানেন যে একটি "পারস্পরিক সম্পর্ক" কী।

এই বিষয়টি উত্থাপন করে যে কেউ যখন মায়াময়ভাবে নির্বোধদের সাথে কীভাবে আচরণ করে এবং যখন তারা একটি সত্যিই বোবা প্রশ্ন জিজ্ঞাসা করে, "আপনি 99% ভবিষ্যদ্বাণীক নির্ভুলতা পাচ্ছেন না কেন?" একটি ভাল প্রতিক্রিয়া হ'ল এই প্রশ্নের সাথে উত্তর দেওয়া, "আপনি কেন এমন অবাস্তব উচ্চতর পিএ এমনকি সম্ভব বলে ধরে নিবেন?" আরেকটি হতে পারে, "কারণ যদি আমি আসলে 99% পিএ পেয়েছি, তবে আমি ধরেই নিয়েছিলাম যে আমি কিছু ভুল করছি।" যা 90% পিএ সহ এমনকি সম্ভবত সত্য হওয়ার সম্ভাবনা রয়েছে।

মডেল মানের একমাত্র মানদণ্ড হিসাবে পিএর উপর জোর দেওয়ার আরও মৌলিক প্রশ্ন রয়েছে। প্রয়াত লিও ব্রেইমন পরিসংখ্যানগত এবং ভবিষ্যদ্বাণীপূর্ণ মডেলিং সম্প্রদায়ের উপর অনেকগুলি পদচিহ্ন রেখেছিলেন, যার মধ্যে পিএ অন্যতম। পিএর সাথে তাঁর প্রাথমিক উদ্বেগ হ'ল 90 এর দশকে একক কার্ট গাছ চালানোর অন্তর্নিহিততা এবং ত্রুটি সম্পর্কিত বহু সমালোচনা সমাধান করা। তার সমাধানটি ছিল "এলোমেলো বন" কে একটি আনুমানিক এবং অস্থায়ী পদ্ধতি হিসাবে উত্সাহিত করা যা গাছের কাঠামোকে বাদ দিয়ে যথার্থতা সর্বাধিক করে তুলবে এবং অস্থিতিশীলতা হ্রাস করবে। তিনি একক লজিস্টিক রিগ্রেশন মডেল থেকে ত্রুটির বিরুদ্ধে ~ 1000 পুনরাবৃত্তি আরএফ "মিনি-মডেলগুলি" থেকে নিম্নতর এমএসই চিহ্নিত করেছিলেন। একমাত্র সমস্যা হ'ল তিনি কখনও কমলার তুলনায় সুস্বাদু আপেল উল্লেখ করতে বিরক্ত করেন নি:

২০০৮ এর নেটফ্লিক্স পুরস্কার কোনও পরিসংখ্যানবিদ বা দলকে তাদের সুপারিশকারী ব্যবস্থার এমএসইতে উন্নতি করতে সক্ষম হয়ে একটি বিশাল মুদ্রা পুরষ্কার দিয়েছে। সেই সময় নেটফ্লিক্স এই সিস্টেমে এক বছরে ১৫০ মিলিয়ন ডলার ব্যয় করছিল, এই বিষয়টি নিশ্চিত করে যে গ্রাহকদের আনুগত্য এবং সিনেমা কেনার ক্ষেত্রে ব্যয়গুলি আরও বেশি আদায় হয়েছিল যা অন্যথায় কখনও বেছে নেওয়া হয়নি। চূড়ান্ত বিজয়ীরা 107 টি বিভিন্ন মডেলের একটি জটিল টুকরা ব্যবহার করেছিলেন।

নেটফ্লিক্স যেমনটি শিখেছে, আসল সমস্যাটি হ'ল, সম্পূর্ণ লোডড ব্যয়ের দৃষ্টিকোণ থেকে, তাদের বর্তমান মডেলটির তুলনায় ত্রুটির প্রকৃত উন্নতি ছিল 5 পয়েন্টের রেটিংয়ের মাত্র 0.005% হ্রাস। উল্লেখ করার দরকার নেই যে সময়ে তথ্যপ্রযুক্তি ব্যয় হয়, ভারী উত্তোলন এবং 107 মডেলের বিজয়ী নকশার রক্ষণাবেক্ষণ ত্রুটি হ্রাস থেকে কোনও লাভকে বাতিল করে দেয়। এটি প্রদত্ত, নেটফ্লিক্স শেষ পর্যন্ত এমএসই অনুসরণ করা ত্যাগ করে এবং আর কোনও নেটফ্লিক্স পুরষ্কার দেওয়া হয়নি

এবং এটি হ'ল: ভবিষ্যদ্বাণীমূলক ত্রুটিটি হ্রাস করা সহজেই গেমড বা পি-হ্যাক হতে পারে এবং বিশ্লেষক জালিয়াতির ঝুঁকিতে পড়ে (যেমন, এমন একটি সমাধান খুঁজে পাওয়া যা বিশ্লেষকের মডেলিং দক্ষতার গৌরব অর্জন করে, তার সম্ভাব্য বছরের শেষ বোনাসকে ইতিবাচকভাবে প্রভাবিত করে)। তদুপরি, এটি একটি সম্পূর্ণ পরিসংখ্যানগত সমাধান এবং একটি অর্থনৈতিক এবং ব্যবসায়িক শূন্যস্থানে সেট লক্ষ্য। মেট্রিক আনুষঙ্গিক, সমান্তরাল ব্যয়গুলির সামান্য বা কোন বিবেচনা সরবরাহ করে - এ থেকে জেড পর্যন্ত মূল্যায়ন করা খুব বাস্তব অপারেশনাল ফলাফল যা কোনও পূর্ণ-বোঝা, বাণিজ্য-ভিত্তিক সিদ্ধান্ত গ্রহণের প্রক্রিয়াটির একটি অবিচ্ছেদ্য অঙ্গ হওয়া উচিত।

এটি সেই সমস্যাগুলির মধ্যে একটি হয়ে দাঁড়িয়েছে যা সংস্থাগুলিতে এম্বেড করা হয়েছে এবং এটি পরিবর্তন করা খুব কঠিন। অন্য কথায়, আমি সম্পূর্ণরূপে অবগত যে আমি পিএ ব্যবহারের সাথে ক্যাভেটস সম্পর্কে এই ফাঁক দিয়ে উইন্ডমিলগুলিতে ঝুঁকছি।

— DJohnson
সূত্র