অনুদায়ী ডাটা মডেলিং যেখানে সময়ের প্রভাব ব্যক্তিদের মধ্যে কার্যকরী আকারে পরিবর্তিত হয় var


32

প্রসঙ্গ :

কল্পনা করুন যে আপনি একটি অনুদৈর্ঘ্য অধ্যয়ন করেছেন যা 200 প্রতিযোগীদের উপর 20 সপ্তাহের জন্য সপ্তাহে একবার নির্ভরশীল পরিবর্তনশীল (ডিভি) পরিমাপ করেছে। যদিও আমি সাধারণভাবে আগ্রহী, সাধারণত যে ডিভিওগুলি আমি ভাবার পরে চাকরির পারফরম্যান্স বা ক্লিনিকাল মনোবিজ্ঞানের হস্তক্ষেপের পরে বিভিন্ন মঙ্গলজনক পদক্ষেপের অন্তর্ভুক্ত তা বিবেচনা করি।

আমি জানি যে মাল্টিলেভেল মডেলিংটি সময় এবং ডিভিয়ের মধ্যে সম্পর্কের মডেল করতে ব্যবহার করা যেতে পারে। আপনি সহগের (যেমন, ইন্টারসেপ্টস, opালু ইত্যাদি) ব্যক্তির মধ্যে পৃথক হতে এবং অংশগ্রহণকারীদের জন্য নির্দিষ্ট মানগুলি অনুমান করতে পারবেন। তবে যদি দৃশ্যত ডেটাটি পরীক্ষা করার সময় আপনি দেখতে পান যে সময় এবং ডিভির মধ্যে সম্পর্ক নীচের যে কোনও একটি:

  • কার্যকরী আকারে পৃথক (সম্ভবত কিছু লিনিয়ার এবং অন্যগুলি ক্ষতিকারক বা কিছুটির বিচ্ছিন্নতা রয়েছে)
  • ত্রুটির পরিবর্তনে ভিন্ন (কিছু ব্যক্তি এক সময় থেকে পরবর্তী সময়ে আরও উদ্বায়ী হয়)

প্রশ্নসমূহ :

  • এর মতো মডেলিং ডেটার কাছে যাওয়ার ভাল উপায় কী হবে?
  • বিশেষত, বিভিন্ন ধরণের সম্পর্ক চিহ্নিত করতে এবং তাদের ধরণের ক্ষেত্রে ব্যক্তিকে শ্রেণিবদ্ধকরণে কোন পদ্ধতিগুলি ভাল?
  • এই জাতীয় বিশ্লেষণের জন্য আর-এ কী বাস্তবায়ন বিদ্যমান?
  • এটি কীভাবে করবেন সে সম্পর্কে কোনও রেফারেন্স রয়েছে: পাঠ্যপুস্তক বা আসল প্রয়োগ?

উত্তর:


20

আমি নিম্নলিখিত তিনটি দিক দেখার পরামর্শ দেব:

  • অনুদৈর্ঘ্য ক্লাস্টারিং : এটি নিরীক্ষণযোগ্য, তবে আপনি পার্টিশনের গুণমান নির্ধারণের জন্য ক্যালিনস্কি মানদণ্ডের উপর নির্ভর করে কে-মানে পদ্ধতির ব্যবহার করেন (প্যাকেজ কিমি , এবং অনলাইন সহায়তায় অন্তর্ভুক্ত রেফারেন্স); সুতরাং মূলত, এটি পৃথক সময় কোর্সের জন্য নির্দিষ্ট আকৃতি সনাক্ত করতে সহায়তা করবে না, তবে কেবল পৃথক পৃথক একক বিবর্তন প্রোফাইলটি
  • ভিন্নজাতীয়ত্বের জন্য এক ধরণের সুপ্ত বৃদ্ধির কার্ভ অ্যাকাউন্টিং: আমার সেরা অনুমানটি এমপ্লাস সফ্টওয়্যার, বিশেষত এফএকিউ এবং মেলিংয়ের চারপাশের বিস্তৃত রেফারেন্সগুলিতে নজর দেওয়া উচিত । আমি এলোমেলোভাবে প্রভাব গুণিতক ভিন্নযুগীয় মডেল সম্পর্কেও শুনেছি (এই কীওয়ার্ডগুলিতে গুগল করার চেষ্টা করুন)। আমি এই কাগজপত্রগুলি ( 1 , 2 ) আকর্ষণীয় মনে করি, তবে আমি সেগুলি বিশদে দেখলাম না। আমি একবার আমার অফিসে ফিরে স্নায়বিক প্রযুক্তিগত মূল্যায়নের রেফারেন্স সহ আপডেট করব।
  • ফাংশনাল পিসিএ ( fpca প্যাকেজ) তবে এটি কার্যকরী ডেটা বিশ্লেষণ দেখার পক্ষে উপযুক্ত হতে পারে

অন্যান্য তথ্যসূত্র (সবেমাত্র উড়ে ব্রাউজ করা):


1
ধন্যবাদ। একটি ক্লাস্টারিং পদ্ধতি ব্যবহার করার ধারণাটি আমার কাছে এসেছিল। আমি কল্পনা করি যে তাত্ত্বিকভাবে অর্থবহ উপায়ে সম্ভাব্য ব্যক্তি-স্তরের বক্রতা বৈশিষ্ট্যগুলি পর্যাপ্ত পরিমাণে ক্যাপচার এবং ওজন করা চ্যালেঞ্জ হবে। আমি কীভাবে কীভাবে এটি কাজ করে তা একবার দেখে নেব।
জেরোমি অ্যাংলিম

1
ইন্টারফেসটি ভয়াবহ হলেও এটি বেশ ভালভাবে কাজ করে (এবং আমি এটি তৈরির লোকটিকেই জানি :) - আমি দুটি মাস আগে এটি উন্নয়নমূলক পরিমাপের উপর পৃথক প্রোফাইলের ভিত্তিতে ক্লিনিকাল গ্রুপগুলি পৃথক করার জন্য ব্যবহার করেছি (ব্রুনেট-লাজিন)।
chl

1
এফডিএর জন্য এখানে আরও একটি প্রাথমিক রেফারেন্স রয়েছে: psych.mcgill.ca/misc/fda
মাইক লরেন্স

1
আমি বিশেষ করে প্রবেশযোগ্য Ramsay দ্বারা এফডিএ লিংক এই ভূমিকা (2008) পাওয়া gbi.agrsci.dk/~shd/public/FDA2008/FDA_Sage.pdf
Jeromy Anglim

8

আমি অনুপ্রাণিত তথ্য মডেলিংয়ের জন্য অভিযোজিত স্প্লাইনগুলি ব্যবহার করে হেপিং জাংয়ের কয়েকটি কাগজগুলি একবার দেখে নেওয়ার পরামর্শ দিই:

এছাড়াও, আর প্যাকেজ সহ সফ্টওয়্যারটির জন্য মাসল পৃষ্ঠাটি দেখুন ।


6

আমার কাছে দেখে মনে হচ্ছে গ্রোথ মিশ্রণ মডেলগুলির আপনার ত্রুটির বৈকল্পিকতা পরীক্ষা করার অনুমতি দেওয়ার সম্ভাবনা থাকতে পারে। ( পিডিএফ এখানে)। (আমি নিশ্চিত নই যে বহুগুণীয় হেটেরোসেসটেস্টিক মডেলগুলি কী, তবে অবশ্যই আমি সেগুলি পরীক্ষা করে দেখতে হবে)।

প্রচ্ছন্ন গ্রুপ ভিত্তিক ট্র্যাজেক্টোরি মডেলগুলি ক্রিমিনোলজিতে ইদানীং সত্যিই জনপ্রিয় হয়ে উঠেছে। তবে অনেক লোক সহজভাবেই গ্রহণ করে যে গোষ্ঠীগুলি আসলেই রয়েছে এবং কিছু চমত্কার গবেষণা উল্লেখ করেছে যে আপনি এমনকি এলোমেলো ডেটাতেও দলগুলি পাবেন। এছাড়াও নাগিনের গ্রুপ ভিত্তিক মডেলিং পদ্ধতির নোট করা আপনার ত্রুটিটি মূল্যায়নের অনুমতি দেয় না (এবং সত্যই আমি এমন কোনও মডেল দেখিনি যা বিচ্ছিন্নতার মতো কিছু দেখবে)।

যদিও এটি ২০ টি পয়েন্ট সহ কঠিন হবে তবে অনুসন্ধানের উদ্দেশ্যে নিদর্শনগুলি সনাক্তকরণের জন্য সহজ হিউরিস্টিক্স তৈরি করা সহায়ক হতে পারে (যেমন সর্বদা স্বল্প বা সর্বদা উচ্চ, প্রকরণের সহগ)। আমি স্প্রেডশিট বা সমান্তরাল স্থানাঙ্ক প্লটগুলিতে স্পার্কলাইনগুলি কল্পনা করছি তবে আমি সন্দেহ করি যে তারা সহায়ক হবে (আমি সত্যই সত্যই কখনও কোনও সমান্তরাল স্থানাঙ্ক প্লট দেখিনি যা খুব আলোকিত হয়)।

শুভকামনা


@ সিএল, কোনও সমস্যা নেই, আপনি এখানে তালিকাভুক্ত সমস্ত সংস্থার জন্য আপনাকে ধন্যবাদ।
অ্যান্ডি ডব্লিউ

সুপ্ত গোষ্ঠী সম্পর্কে ভাল পয়েন্ট। আমি সুপ্ত শ্রেণীর বিশ্লেষণ এবং ক্লাস্টার বিশ্লেষণের বেশ কয়েকটি অ্যাপ্লিকেশন দেখেছি যেখানে মনে হচ্ছে এটি কেবল নিম্ন ও উচ্চতর ( জেরোম্যাংলিম.ব্লগস্পট . com / 2009 / 09/… ) একটি ধারাবাহিক পরিবর্তনশীল int বিভাগগুলি খোদাই করা আছে । তবে আমার কাছে কিছু স্বতন্ত্র-স্তরের অনুদৈর্ঘ্য তথ্য রয়েছে যা দৃশ্যত দেখে মনে হচ্ছে তারা পৃথক পৃথক ডেটা উত্পন্ন প্রক্রিয়াগুলি (যেমন, সর্বদা উচ্চ, সর্বদা নিম্ন, ধীরে ধীরে ক্রমবর্ধমান, কম-পরে-আকস্মিক বৃদ্ধি ইত্যাদি) এবং বিভাগগুলির মধ্যে আসে like পরামিতিগুলির আরও ক্রমাগত প্রকরণ রয়েছে।
জেরোমি অ্যাংলিম

@ জারোমি, আমি মনে করি না যে কাজটি আমি উদ্ধৃত করেছি তা মানুষকে সুপ্ত গোষ্ঠীগুলি সনাক্ত করতে এই জাতীয় পদ্ধতি ব্যবহার করা থেকে নিরুৎসাহিত করবে। আমি বলব কাজের মূল বিষয়টি হ'ল আপনি গোষ্ঠীগুলির অস্তিত্ব নির্ধারণের জন্য এ জাতীয় পদ্ধতি ব্যবহার করতে পারবেন না, কারণ আপনি সর্বদা দলগুলি পাবেন, এমনকি এলোমেলো ডেটাতেও। আপনি যে দলগুলি খুঁজে পেয়েছেন সেগুলি আসল কিনা বা কেবল পদ্ধতিটির নিদর্শন কিনা তা আরও বিষয়গত ব্যাখ্যার উপর নির্ভর করে। আপনি কিছু যৌক্তিক তত্ত্বগুলি সনাক্ত করতে পারেন যা এই জাতীয় প্রক্রিয়াগুলি উত্পন্ন করে এবং তারপরে এটি চিহ্নিত করা গ্রুপগুলি সেই তত্ত্বগুলির মধ্যে উপযুক্ত কিনা।
অ্যান্ডি W

5

এই প্রশ্ন জিজ্ঞাসার চার বছর পরে, আমি কয়েকটি জিনিস শিখেছি, তাই সম্ভবত আমার কয়েকটি ধারণা যুক্ত করা উচিত।

আমি মনে করি বায়েশিয়ান শ্রেণিবদ্ধ মডেলিং এই সমস্যার জন্য নমনীয় দৃষ্টিভঙ্গি সরবরাহ করে।

সফ্টওয়্যার : জাগস, স্ট্যান, উইনব্যাগস এবং অন্যান্য জাতীয় সরঞ্জামগুলি তাদের নিজ নিজ আর ইন্টারফেস প্যাকেজগুলির সাথে সংযুক্ত করে (যেমন, rjags, আর্স্টান) এই জাতীয় মডেলগুলি নির্দিষ্ট করা সহজ করে তোলে।

ব্যক্তির ত্রুটির মধ্যে পরিবর্তনশীল: বায়েসিয়ান মডেলগুলি এলোমেলো ফ্যাক্টর হিসাবে ব্যক্তির মধ্যে ত্রুটিটি ব্যক্তির মধ্যে নির্দিষ্ট করে দেওয়া সহজ করে তোলে যা মানুষের মধ্যে পরিবর্তিত হয়।

Yআমি=1,,এন=1,জে

Yআমি~এন(μআমি,σআমি2)
μআমি=γ
γ~এন(μγ,σγ2)
σআমি~জিএকটিমিমিএকটি(α,β)

সুতরাং প্রতিটি ব্যক্তির স্ট্যান্ডার্ড বিচ্যুতি গামার বিতরণ হিসাবে মডেল করা যেতে পারে। আমি এটি অনেকগুলি মনস্তাত্ত্বিক ডোমেনে একটি গুরুত্বপূর্ণ পরামিতি হিসাবে পেয়েছি যেখানে লোকেরা সময়ের সাথে তারা কতটা পরিবর্তিত হয় in

বক্ররেখার প্রচ্ছন্ন ক্লাস: আমি এই ধারণাটি এখনও তেমন অন্বেষণ করি নি, তবে প্রতিটি ব্যক্তির জন্য দুটি বা ততোধিক সম্ভাব্য ডেটা উত্পন্ন ফাংশন নির্দিষ্ট করে তুলতে তুলনামূলকভাবে সোজা এগিয়ে দেওয়া এবং তারপরে বায়েসিয়ান মডেল কোনও প্রদত্ত ব্যক্তির জন্য সর্বাধিক সম্ভাব্য মডেলটি বেছে নিতে দেয়। সুতরাং, আপনি সাধারণত প্রতিটি ব্যক্তির জন্য পরবর্তী ক্রিয়াকলাপ পাবেন যা কার্যকরী ফর্ম ব্যক্তিগুলির ডেটা বর্ণনা করে তা সম্পর্কিত।

কোনও মডেলটির জন্য একটি ধারণার স্কেচ হিসাবে আপনার নীচের মতো কিছু থাকতে পারে:

yijN(μij,σ2)
μij=γiλij(1)+(1γi)λij(2)
λij(1)=θ1i(1)+θ2i(1)exp(θ3i(1))
λij(2)=θ1i(2)+θ2i(2)xij+θ3i(2)xij2
γi=Bernoulli(πi)

xijλij(1)λij(2)πiλij(1)


আমি বায়েশিয়ান কাঠামোর দিকেও চলেছি, এবং অনিশ্চিত ফাংশন ফর্মগুলির সময় সিরিজের বিশ্লেষণের জন্য গাউসিয় প্রক্রিয়াগুলি ব্যবহার করার বিষয়ে পড়ছি। শ্রেণিবদ্ধ তথ্যগুলির ক্ষেত্রে এটি কীভাবে প্রয়োগ করা যেতে পারে তা এখনও অস্পষ্ট (আমার উত্তরবিহীন ক্যোয়ারীটি এখানে দেখুন: groups.google.com/d/msg/stan-users/yjDWtMhxQQE/2TiYevy0ZwUJ )
মাইক লরেন্স

3

জন ফক্সের দ্রাঘিমাংশের ডেটা দেখার জন্য এনএলএমএল ব্যবহার করে অনলাইনে একটি দুর্দান্ত পরিশিষ্ট রয়েছে। এটি আপনার পক্ষে কার্যকর হতে পারে:

http://cran.r-project.org/doc/contrib/Fox-Companion/appendix-mixed-models.pdf

সেখানে প্রচুর দুর্দান্ত জিনিস রয়েছে (এবং ফক্সের বইগুলি সাধারণত বেশ ভাল!)।


2
ছিন্ন সুত্র. তবে এটি এখানে
Glen_b -Rininstate Monica
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.