আমি কিছু পরিসংখ্যান খুঁজছি (এবং সম্ভাবনা, আমি অনুমান) সাক্ষাত্কার প্রশ্ন, সবচেয়ে উন্নত মাধ্যমে সবচেয়ে বেসিক থেকে। উত্তরগুলি প্রয়োজনীয় নয় (যদিও এই সাইটের নির্দিষ্ট প্রশ্নের লিঙ্কগুলি ভাল করবে)।
আমি কিছু পরিসংখ্যান খুঁজছি (এবং সম্ভাবনা, আমি অনুমান) সাক্ষাত্কার প্রশ্ন, সবচেয়ে উন্নত মাধ্যমে সবচেয়ে বেসিক থেকে। উত্তরগুলি প্রয়োজনীয় নয় (যদিও এই সাইটের নির্দিষ্ট প্রশ্নের লিঙ্কগুলি ভাল করবে)।
উত্তর:
কাজটি কী তা নিশ্চিত তা নয় তবে আমি মনে করি "এক্সকে কোনও নবজাতকের কাছে ব্যাখ্যা করুন" সম্ভবত ভাল হবে-
ক) কারণ তারা সম্ভবত এই কাজ করতে হবে
খ) এটি বোঝার একটি ভাল পরীক্ষা, আমি গণনা করি।
আমি যে স্ট্যান্ডার্ড প্রশ্নটিতে কাজ করি সেটির লাইন বরাবর রয়েছে:
আপনি যে স্ট্যাটিস্টিকাল প্যাকেজটি ব্যবহার করেছেন বলে দাবি করেছেন তার একাধিক লজিস্টিক রিগ্রেশনের এই আউটপুটটি একবার দেখুন (সম্ভবত আমরা খুব বেশি ব্যবহার করি)। XXX হ'ল মূল আগ্রহের স্বাধীন পরিবর্তনশীল। বিষয়টির জ্ঞান থাকলেও কোনও আনুষ্ঠানিক পরিসংখ্যান প্রশিক্ষণ নেই এমন কোনও সহকর্মীর জন্য আপনি ফলাফলকে কীভাবে ব্যাখ্যা করবেন? (যদি বিন্দু অনুমানের পৃথক ব্যাখ্যার জন্য প্রম্পট প্রয়োজন হয়, সিআই, পি-মান)।
ইন্টারভিউ হ'ল আগ্রহের কাঠামো পরিমাপের জন্য সেরা মাধ্যম কিনা তা আপনিও প্রতিফলিত করতে চাইতে পারেন। আপনি যদি সম্ভাব্যতা বা পরিসংখ্যানগুলির পূর্বের জ্ঞানটি পরিমাপ করতে চান তবে আপনি লিখিত পরীক্ষার উপর বেশি নির্ভর করা ভাল। আপনি আরও প্রশ্ন জিজ্ঞাসা করতে পারেন, এবং এইভাবে পরিমাপের নির্ভরযোগ্যতা বৃদ্ধি করতে পারেন। প্রশাসনে এবং স্কোরিং উভয়ই এটি আরও মানসম্মত। এবং একবার যন্ত্রটি বিকাশ হয়ে গেলে এটি পরিচালনা করতে সম্ভবত কম সংস্থান ব্যবহার করে।
তারপরে আপনি ইন্টারভিউকে আরও বেশি কেন্দ্রীভূত সরঞ্জাম হিসাবে মৌখিক এবং আন্তঃব্যক্তিক দক্ষতার মতো বিষয়গুলির দিকে নজর দিতে পারেন।
আমাকে দুটি প্রশ্ন জিজ্ঞাসা করা হয়েছে:
1) আপনি অন্য বিভাগের একজন শ্রমিকের নির্দিষ্ট ভেরিয়েবলের প্রভাব পরীক্ষা করতে একাধিক রিগ্রেশন ফিট করে। ভেরিয়েবলটি তুচ্ছ ফিরে আসে তবে আপনার সহকর্মী বলে যে এটি অসম্ভব কারণ এটির প্রভাব রয়েছে বলে জানা যায়। আপনি কি বলবেন / করবেন?
2) আপনার 1000 ভেরিয়েবল এবং 100 টি পর্যবেক্ষণ রয়েছে। আপনি একটি নির্দিষ্ট প্রতিক্রিয়া জন্য উল্লেখযোগ্য পরিবর্তনশীল সন্ধান করতে চাই। আপনি কি করতে চান?
এখানে একটি বড় ডেটা সেট। আউটলিয়ারদের সাথে ডিল করার জন্য আপনার পরিকল্পনা কী? কীভাবে মূল্যবোধ হারিয়ে যাচ্ছে? রূপান্তর সম্পর্কে কীভাবে?
তারা কি বাস্তব-বিশ্বের ডেটা নিয়ে কাজ করতে পারে?
এই সাইটের অনেক প্রশ্ন / উত্তর ভাল প্রশ্নের জন্য ধারণা দিতে পারে। আমি এমন কিছু লিঙ্কের সাথে একটি তালিকা দেব যা আমার মনে হয় ভাল। যে পোস্টগুলিতে আমি জবাব দিয়েছি সেগুলি উপস্থাপিত হয়েছে, কারণ আমি সেই পোস্টগুলি আরও ভাল জানি, কারণ এগুলি অগত্যা সেরা নয়! আমি প্রতিটি লিঙ্কে সংক্ষিপ্ত মন্তব্য করি, আপনি লিঙ্কটি অনুসরণ করতে চান কিনা তা আপনি সিদ্ধান্ত নিতে পারেন।
এসভিডির পিছনে অন্তর্দৃষ্টি কী? "আপনি কীভাবে আমাদের ক্লায়েন্টকে ব্যাখ্যা করতে পারেন যে এসভিডি কীভাবে কাজ করে?"
সাধারণ লোকের পদে সর্বাধিক সম্ভাবনা অনুমান (এমএলই) "আপনি কি ননটেকনিক্যাল ভাষায় সর্বাধিক সম্ভাবনার অনুমানের ধারণাটি ব্যাখ্যা করতে পারবেন?"
তালেব এবং কালো রাজহাঁস "আমাকে বলুন, একটি কালো রাজহাঁ কী, এবং কেন এটি প্রাসঙ্গিক? এটি কখন প্রাসঙ্গিক?"
যখন নমুনাটি "জনসংখ্যা " হয় তখন পরিসংখ্যানগত অনুমিতি যখন নমুনা পুরো জনসংখ্যা হয় তখন আপনি পরিসংখ্যানিক অনুক্রম সম্পর্কে কী বলতে পারেন? "
সুস্থতার সদ্ব্যবহার এবং কোন মডেলটি লিনিয়ার রিগ্রেশন বা পইসন বেছে নেবেন "আমাদের একটি রিগ্রেশন সমস্যা রয়েছে যেখানে প্রতিক্রিয়াটি একটি গণনা পরিবর্তনশীল this আপনি এই প্রসঙ্গে কোনটি বেছে নেবেন, সাধারণ ন্যূনতম স্কোয়ারগুলি বা পোইসন রিগ্রেশন (বা অন্য কোনও কিছু) আপনার পছন্দ ব্যাখ্যা করুন? , এই মডেলগুলির মধ্যে প্রধান পার্থক্য কী? "
সীমাবদ্ধ এবং অসীম প্রকরণের মধ্যে পার্থক্য কী "আপনি কী ব্যাখ্যা করতে পারবেন, যতটা সম্ভব সহজ ভাষায়, একটি এলোমেলো পরিবর্তনশীলের অসীম প্রত্যাশা বা অসীম বৈকল্পিকতাটির অর্থ কী? এই পার্থক্যের ব্যবহারিক গুরুত্ব কী? একটি ব্যাখ্যা দিয়ে ব্যাখ্যা করুন? উদাহরণ। "
পদক্ষেপের প্রতিরোধের আধুনিক, সহজেই ব্যবহৃত বিকল্পগুলি কী কী? "যখন সম্ভাব্য ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি রয়েছে তখন আপনি কীভাবে একটি জটিল রিগ্রেশন মডেল তৈরি করবেন? বিভিন্ন সম্ভাব্য কৌশলগুলি বর্ণনা করুন এবং তাদের প্রতিটিটির সাথে সমস্যাগুলি সম্পর্কে বলুন"
লজিস্টিক রিগ্রেশন নিখুঁত পৃথকীকরণ মোকাবেলা কিভাবে? "লজিস্টিক রিগ্রেশন, এর কারণ, লক্ষণগুলিতে পৃথকীকরণের সমস্যা কী? যদি এটি সত্যিই সমস্যা হয় তবে এটি সমাধান করার জন্য আপনি কী করতে পারেন?"
পারস্পরিক সম্পর্ক মেট্রিক্সকে কেন ইতিবাচক অর্ধ-নির্দিষ্ট হওয়া দরকার এবং ইতিবাচক অর্ধ-নির্দিষ্ট হওয়া বা হওয়া বা বোঝার অর্থ কী? এবং
একটি অ ইতিবাচক নির্দিষ্ট কোভেরিয়েন্স ম্যাট্রিক্স আমার ডেটা সম্পর্কে আমাকে কী বলে? "ব্যাখ্যা করুন কেন একটি সমবায় ম্যাট্রিক্স অবশ্যই ইতিবাচক (আধা) নির্দিষ্ট হতে হবে এবং এর অর্থ কী? কীভাবে এই সত্যটি ব্যবহার করা যেতে পারে?"
মিডিয়ানের বহুমাত্রিক সংস্করণগুলি কী "" ডেটা মাল্টিভারিয়েট করার জন্য মিডিয়াকে সাধারণকরণের কোনও উপায় আপনি প্রস্তাব করতে পারেন? "
শ্রেণিবদ্ধ ভেরিয়েবলগুলির সাথে লজিট রিগ্রেশনে ইন্টারঅ্যাকশন শর্তাদি ব্যাখ্যা এবং ইন্টারঅ্যাকশন প্রভাবগুলি চিহ্নিত করার জন্য সেরা অনুশীলনগুলি কী? এবং দুটি নেতিবাচক প্রধান প্রভাব এখনও ইতিবাচক মিথস্ক্রিয়া প্রভাব? এবং কোনও মডেলের মূল প্রভাবগুলি নয় তবে ইন্টারঅ্যাকশন সহ এবং যখন ইন্টারঅ্যাকশন প্রভাবটি তাৎপর্যপূর্ণ নয় তখন কীভাবে প্রধান প্রভাবগুলি ব্যাখ্যা করবেন? "রিগ্রেশন মডেলগুলির মধ্যে মিথস্ক্রিয়া বলতে কী বোঝায় তা ব্যাখ্যা করুন if বিশেষত, প্রধান প্রভাবগুলি না থাকলেও ইন্টারঅ্যাকশনটি উল্লেখযোগ্য হলে এর অর্থ কী? সাধারণ লিনিয়ার রিগ্রেশন এবং লজিস্টিক রিগ্রেশন এর মধ্যে মিথস্ক্রিয়াটির ব্যাখ্যা করার মধ্যে কিছু পার্থক্য রয়েছে?"
ডেটাতে স্কোয়ার রুটের রূপান্তর ব্যবহারের কারণ কী হতে পারে? এবং যথাযথ ডেটা ট্রান্সফর্মেশন "আপনি কখন, কীভাবে এবং কেন রেগ্রেশন (বা আনোভা) মডেলটিতে প্রতিক্রিয়া পরিবর্তনশীল রূপান্তর করেন? কোনও বিকল্প আছে কি?
আমি কি সাধারণভাবে বিতরণ করা ডিভি-র জন্য আওানো ফলাফলগুলিতে বিশ্বাস রাখতে পারি? "আপনি নন-নরমালাল রেসিডুয়ালের সাথে একটি আনোভা কেমন ব্যবহার করবেন?
পরিসংখ্যান কেন দরকারী যখন অনেকগুলি জিনিস একটি শট জিনিস?
আমি কীভাবে দক্ষতার সাথে বেরনুলি এলোমেলো ভেরিয়েবলগুলির যোগফলকে মডেল করতে পারি?
সাধারণ অনুমানের সমীকরণ বনাম মিশ্র প্রভাবগুলির মডেলগুলি কখন ব্যবহার করবেন?
এখানে কি ঘটছে, যখন আমি লজিস্টিক রিগ্রেশন সেটিংয়ে স্কোয়ার লস ব্যবহার করি? "কেন আমরা লজিস্টিক রিগ্রেশন জন্য ম্যাক্সিমুল সম্ভাবনা ব্যবহার করি? কেন ন্যূনতম স্কোয়ার হয় না?"
আমাকে একবার জিজ্ঞাসা করা হয়েছিল যে আমি সামাজিক সায়েন্সের এমন এক শ্রেণীর নবীন শ্রেণীর কাছে কেন্দ্রীয় সীমাবদ্ধ তাত্ত্বিকতার প্রাসঙ্গিকতাটি কীভাবে বর্ণনা করব যা পরিসংখ্যান সম্পর্কে সবে জ্ঞান আছে?
এমন কিছুকে কীভাবে সংখ্যায়িত করবেন না?
উদাহরণ, "অডিও ডেটা শ্রেণিবদ্ধ করার জন্য স্বয়ংক্রিয় বৈশিষ্ট্য নিষ্কাশন"
যুক্তি: তারা কীভাবে পরিসংখ্যানগতভাবে এমন কোনও বিশদ বিশ্লেষণ করবেন যেটি ইতিমধ্যে বড় টেবিলে নেই?
আপনি যখন একটি পরিসংখ্যানের মডেল তৈরি করছেন তখন কীভাবে আপনি অতিরিক্ত ফিটিং প্রতিরোধ করবেন?
উত্তম উত্তর: ক্রস-বৈধতা
আমি প্রায়শই জিজ্ঞাসা করি "পূর্বাভাসটি কী কী আপনি সংজ্ঞা / ব্যাখ্যা করবেন?"
সাধারণ ধরণের সাধারণ প্রশ্নের উত্তর আমাকে ভবিষ্যদ্বাণী করার কোনও বিশেষ ক্ষেত্রে সংযুক্ত কিনা তা দেখতে আমাকে সহায়তা করে। সঠিক উত্তর নেই তবে একটি সাক্ষাত্কারের সময় সিন্থেটিকভাবে উত্তর দেওয়া সবসময় সহজ নয় :)
পর্যবেক্ষণমূলক ডেটা প্রসঙ্গে:
এই স্থিতিশীল সমস্যাটিতে প্রয়োগ করা এই রিগ্রেশন মডেলটি বিবেচনা করুন। কী, যদি এর কিছু থাকে তবে তা কার্যত ব্যাখ্যা করা যায়? [আরও অনুসন্ধান] আপনার মতামত পরিবর্তন করতে আপনার কী শিখতে হবে?
বেঙ্গালুরুতে আপনি চন্দন কাঠের গাছের সংখ্যা কীভাবে গণনা করবেন?
কারসেশন বনাম পারস্পরিক সম্পর্ক শিরোনামের অধীনে :
ভবিষ্যদ্বাণীমূলক মডেলের বৈশিষ্ট্য হিসাবে গ্রাহক / ব্যবহারকারীর ব্যস্ততা ব্যবহার করা সাধারণ। উদাহরণস্বরূপ, যারা এই বোতামটি ক্লিক করেন তাদের পক্ষে সাবস্ক্রাইব হওয়ার সম্ভাবনা বেশি। মঙ্গলবার যারা কেনাকাটা করেন তাদের চেয়ে সোমবার কেনাকাটা করা লোকেরা আবার শপিংয়ের সম্ভাবনা বেশি থাকে।
আমরা যদি এটি একটি চূড়ান্ত দিকে নিয়ে যাই: ব্যবহারকারীরা যারা "ক্রয়" ক্লিক করেন তারা যে পণ্য ক্রয় ক্লিক করেন না তাদের চেয়ে পণ্য ক্রয়ের সম্ভাবনা বেশি।
তবে অবশ্যই কিছু ব্যবহারকারী কেন সাবস্ক্রাইব করেন এবং কিছু লোক কেন তা করেন না তা ব্যাখ্যা করতে এটি খুব সহায়ক নয়।
আপনি গ্রাহক বৈশিষ্ট্যগুলি ব্যবহার করে কীভাবে ভারসাম্য বজায় রাখবেন যা তারা ব্যাখ্যা করে যে কেন তারা সাবস্ক্রাইব করে যেগুলি সাবস্ক্রিপশনের সাথে অত্যন্ত সম্পর্কিত, তবে কার্য সম্পাদন করার জন্য প্রয়োজনীয়?
এখানে একটি টিঙ্কারটাই আছে সেট রয়েছে। ইউক্লিডিয়ান দূরত্বটি তিন মাত্রায় কীভাবে কাজ করে তা আমাকে দেখান। এখন আমাকে দেখান কীভাবে একাধিক রিগ্রেশন কাজ করে।
তারা কী ব্যাখ্যা করতে পারে যে শারীরিক বিশ্বে পরিসংখ্যান কীভাবে কাজ করে?
আমরা একটি গ্রাহক পরিষেবা কেন্দ্র পরিচালনা করছি। আমরা প্রতি মাসে 1 মিলিয়ন কল পাচ্ছি। কীভাবে আমরা এটি দশ হাজারে হ্রাস করব?
আমরা জিজ্ঞাসা করি এমন অনেকগুলি প্রশ্ন এর সাথে ইতিমধ্যে বর্ণিত হয়েছে। তবে কিছু যে আমি এখনও পড়িনি, যা ব্যবহার করা হয়েছে: হোয়াইটবোর্ডে আপনাকে এমন কিছু করার জন্য কোনও প্রোগ্রাম স্কেচ করার জন্য বলা যেতে পারে: ডাইস রোলিং বা অন্যান্য সম্ভাব্যতার সমস্যা অনুকরণ করুন, বা একাধিক মৌলিক সংখ্যা গণনা করুন (যেমন সমস্ত ১,০০,০০০ এরও কম সংখ্যক মূল সংখ্যা) - আপনি যে ভাষাটি চান তা করতে আপনি এটি করতে সক্ষম হবেন তবে বেশিরভাগ লোক আর বেছে নেয় এবং কিছু পাইথন বেছে নেয় (আমি বিশ্বাস করি) তবে আপনি অনুমান করেন যে আপনি স্টাটা, এসএএস, এসপিএস বেছে নিতে পারেন , মতলব ইত্যাদি। আপনার পছন্দসই প্রোগ্রামিং ভাষার আপনার জ্ঞানের গভীরতার তদন্ত করার জন্য আপনাকে সম্ভবত প্রশ্ন জিজ্ঞাসা করা হবে - উদাহরণস্বরূপ, আর-এ লুপের পরিবর্তে প্রয়োগ করুন কেন।
আপনাকে কিছু তদন্ত করার জন্য একটি পরীক্ষা বা অন্যান্য অধ্যয়নের নকশা তৈরি করতে বলা হতে পারে - সাধারণত ব্যবহারিক কিছু - কখনও কখনও এটি আমাদের করা কাজের সাথে সম্পর্কিত হবে, তবে প্রায়শই নয়। (আমরা যে কাজটি করি সে সম্পর্কে আপনার জ্ঞান থাকার কথা নয়, তবে আপনি যে সমস্যার কথা শুনে নি সে সম্পর্কে ধারণাটি উপলব্ধি করতে এবং বুদ্ধিমানের সাথে অনুমান করতে সক্ষম হবেন, এমনকি কিছু নির্দিষ্ট ডোমেইন জ্ঞান যদি আপনি জানতেন তবেও এটি ভুল ছিল - এটি ঠিক আছে, আপনি ডোমেন জ্ঞান রাখবেন বলে আশা করা যায় না)। আপনাকে পাওয়ারের মতো জিনিসগুলিকে আমলে নিতে বলা হতে পারে।
পরিমাণগত ভেরিয়েবলের বৈকল্পিক বিশ্লেষণ করার সময়, কখনও কখনও দেখা যায় যে ভেরিয়েবলের ফ্রিকোয়েন্সি খুব বেশি (> 5) থাকে তবে আমরা ভেরিয়েবলের স্বাধীনতা খুঁজে পেতে ফিশারের সঠিক পরীক্ষাটি ব্যবহার করি।
গত বছর ইয়াঙ্কিস গেমসে গড় প্রদত্ত উপস্থিতি ছিল 55,000। আপনি এলোমেলোভাবে এনওয়াইসি-র একগুচ্ছ লোককে জিজ্ঞাসা করেন যে তারা গত মরসুমে ইয়াঙ্কিস খেলায় গিয়েছিল এবং যদি তারা তা করে থাকে তবে আপনি অর্থ প্রদানের উপস্থিতি রেকর্ড করেন। যে গেমগুলিতে আপনি জিজ্ঞাসা করেছিলেন যে খেলাগুলিতে কারা গেছেন তাদের জন্য গড় প্রদত্ত উপস্থিতি কী?
আমি আমার উত্তরের জন্য আপনাকে ইঙ্গিত দেব (ইঙ্গিতটি সরবরাহ করা হয়নি): দৈর্ঘ্য-পক্ষপাতমূলক নমুনা। আমি এটির উপর একটি হোম রান করেছি, তবে এটি খেলা জিতাই যথেষ্ট ছিল না, হা হা। দ্রষ্টব্য: স্যাম্পলিংটি কীভাবে করা হয়েছিল সে সম্পর্কিত আমি অনেক সাবধানবাণী উল্লেখ করেছি এবং সাক্ষাত্কারকারীর আমাকে সে সমস্তকে উপেক্ষা করার কথা বলেছিল।