ইভেন্টের সময় সম্পর্কে অনিশ্চয়তার সাথে একটি সময় সিরিজের ইভেন্টগুলির জন্য ইন্টারটারের নির্ভরযোগ্যতা


13

আমার কাছে একাধিক স্বতন্ত্র কোডার রয়েছে যারা একটি সময়ের সিরিজের ইভেন্টগুলি সনাক্ত করার চেষ্টা করছেন - এই ক্ষেত্রে, সামনাসামনি কথোপকথনের ভিডিওটি দেখছেন এবং নির্দিষ্ট অমানবিক আচরণগুলি (যেমন, মাথা নোড) সন্ধান করছেন এবং প্রত্যেকটির সময় এবং বিভাগের কোডিং করবেন ইভেন্ট। এই ডেটাটিকে উচ্চতর স্যাম্পলিং হার (30 ফ্রেম / সেকেন্ড) সহ একটি বিচ্ছিন্ন সময় সিরিজ হিসাবে বিবেচনা করা যেতে পারে বা যেগুলির সাথে কাজ করা সহজতর ক্রমাগত সময়ের সিরিজ হিসাবে বিবেচনা করা যেতে পারে।

আমি আন্ত রেট প্রদানকারী নির্ভরযোগ্যতা কিছু পরিমাপ গনা করতে চাই, কিন্তু আমি কিছু অনিশ্চয়তা সেখানে হতে আশা যখন ঘটনা ঘটেছে; এটি, আমি প্রত্যাশা করি যে একটি কোডার সম্ভবত উদাহরণস্বরূপ, কোড যা অন্য কোডাররা ভেবেছিল যে এটি শুরু হয়েছে তার চেয়ে এক চতুর্থাংশ পরে শুরু হয়েছিল movement এটি বিরল ঘটনা, যদি এটি সাহায্য করে; ইভেন্টগুলির মধ্যে সাধারণত কমপক্ষে কয়েক সেকেন্ড (শত শত ভিডিও ফ্রেম)

সেখানে আন্ত রেট প্রদানকারী নির্ভরযোগ্যতা নির্ধারণে এটি একটি দুর্দান্ত উপায় সেই চুক্তির ও মতানৈক্য এই ধরনের উভয় সময়ে দেখায়: (1) রেটপ্রদানকারী উপর একমত কি ঘটনা ঘটেছে (যদি থাকে), এবং (2) তারা একমত যখন এটা ঘটেছে? দ্বিতীয়টি আমার পক্ষে গুরুত্বপূর্ণ কারণ আমি কথোপকথনে ঘটে যাওয়া অন্যান্য বিষয়গুলির সাথে সম্পর্কিত, যেমনটি লোকেরা কী বলছে তার তুলনায় এই ইভেন্টগুলির সময় দেখতে আগ্রহী।

আমার ক্ষেত্রে স্ট্যান্ডার্ড অনুশীলন বলে মনে হচ্ছে জিনিসগুলি সময়ের টুকরোতে ভাগ করা, এক সেকেন্ডের 1/4 বলুন, প্রতিটি কোডার প্রতি সময় স্লাইসে প্রতিবেদন করা ইভেন্টগুলিকে একত্রিত করুন, তারপরে কোহেনের কাপা বা কিছু অনুরূপ পরিমাপ করুন। তবে স্লাইস সময়কাল পছন্দ অ্যাড-হক, এবং ইভেন্টগুলির সময় আমি অনিশ্চয়তার একটি ভাল ধারণা পাই না।

আমার এখনও অবধি সবচেয়ে ভাল ধারণাটি হ'ল আমি কোনও ধরণের নির্ভরযোগ্যতা বক্ররেখা গণনা করতে পারি; উইন্ডোর আকারের ফাংশন হিসাবে কাপা জাতীয় কিছু যার মধ্যে আমি একই সাথে দুটি ইভেন্ট কোডিং হিসাবে বিবেচনা করি। আমি সেখান থেকে কোথায় যাব সত্যই আমি নিশ্চিত নই, যদিও ...


দেখে মনে হচ্ছে এমন পরিস্থিতি যেখানে কার্যকরী ডেটা বিশ্লেষণ পদ্ধতি প্রয়োগ করা যেতে পারে। আপনি তাদের বিবেচনা করেছেন?
এমপিটিকাস

আমি কার্যকরী ডেটা বিশ্লেষণ সম্পর্কে ভেবেছিলাম, তবে এটি এমন অঞ্চল নয় যা আমি খুব পরিচিত। আমি এখন রামসে এবং সিলভারম্যানের বইয়ের মাধ্যমে কাজ করছি। তবে আমি তাত্ক্ষণিকভাবে দেখতে পাচ্ছি না যে কীভাবে বহুজাতিক ফলাফলের পরিবর্তনশীলগুলি মোকাবেলা করা ...?

এই পরিমাপগুলির জন্য কি কোনও স্বর্ণের মান পাওয়া যায় (যেমন, আপনি কী জানেন যে ইভেন্টগুলি কখন আগ্রহী হয়)? এই গবেষণায় কয়টি কোডার অন্তর্ভুক্ত রয়েছে? আমরা কত স্বতন্ত্র ঘটনা আশা করতে পারি?
সিএল

উত্তর:


2

এখানে চিন্তা করার কয়েকটি উপায়'s

1

ক) আপনি কোডিংয়ের প্রতিটি সম্পূর্ণ অনুক্রমকে ইভেন্টের অর্ডার সেট হিসাবে (যেমন ["মাথা নোড", "মাথা ঝাঁকুনি", "মাথা নোড", "ভ্রু উত্থিত"] এবং "" মাথা নাক "," মাথা কাঁপুন ") হিসাবে আচরণ করতে পারেন , "ভ্রু উত্থিত"]), তারপরে অ্যালগরিদম ব্যবহার করে ক্রমগুলি সারিবদ্ধ করুন যা আপনাকে উপলব্ধি করেছে ( http://en.wikedia.org/wiki/Sequence_alignment )। তারপরে আপনি পুরো ক্রমটির জন্য আন্তঃ কোডার নির্ভরযোগ্যতা গণনা করতে পারেন।

খ) তারপরে, আবার সারিবদ্ধ ক্রমগুলি ব্যবহার করে আপনি যখন তুলনামূলকভাবে বলতে পারেন যে তারা যখন একটি ইভেন্ট ঘটেছে, তারা উভয়ই ঘটনাটি পর্যবেক্ষণ করেছে।

2) পর্যায়ক্রমে, আপনি এটি একটি লুকানো মার্কভ মডেল হিসাবে মডেল করতে পারেন এবং সম্ভাবনাগুলি বোঝাতে বাউমেন-ওয়েলচ অ্যালগরিদমের মতো কিছু ব্যবহার করতে পারেন যা কিছু প্রকৃত ঘটনা দেওয়া হলেও প্রতিটি কোডার প্রকৃতপক্ষে ডেটা সঠিকভাবে কোড করে। http://en.wikipedia.org/wiki/Baum-Welch_algorithm


এই কৌশলটি গ্রাফসগার্ড 2012 এর মতো সাউন্ডিং টাস্কের জন্য যা করেছে তার অনুরূপ বলে মনে হয় ।
কেভিনল

0

যথেচ্ছ টুকরো টুকরো টুকরো টুকরো করার পরিবর্তে আপনি প্রকৃত সময়ের পার্থক্য বিবেচনা করতে পারেন। কোডার 1 সময় এবং ক্রিয়াকলাপের প্রতিবেদন করে:

049 D
113 C
513 C
724 G

অন্যান্য কোডারদের মতে কোন কোডার সবচেয়ে নির্ভরযোগ্য এটি দেখার একটি সহজ উপায় হ'ল তার মতো স্কোর দেওয়া:

Add a point for each other coder that reported a D between (049-025) and (049+025)
Add a point for each other coder that reported a C between (113-025) and (113+025)
Add a point for each other coder that reported a C between (513-025) and (513+025)
Add a point for each other coder that reported a C between (724-025) and (724+025)
Subtract a point for each reported action.

যদি ঘনিষ্ঠতা আপনার পক্ষে গুরুত্বপূর্ণ, তবে এই জাতীয় বিকল্পগুলি বিবেচনা করুন:

Add 25/(Time_Thiscoder-Time_Othercoder)^2 points for each other coder that reported a matching observation.

সমস্ত সমস্যার তথ্য উপলব্ধ থাকলে ব্যবহারিক উপায়ে এই ধারণাটি কার্যকর করা কঠিন হবে না।


1
"25" কোথা থেকে এসেছে? আপনার কাছে কি রেফারেন্স রয়েছে বা আপনি এই প্রস্তাবটিকে ন্যায্য বলে প্রমাণিত তত্ত্বটি ব্যাখ্যা করতে পারেন?
শুকনো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.