অনুদৈর্ঘ্য ডেটা: সময় সিরিজ, পুনরাবৃত্তি ব্যবস্থা, বা অন্য কিছু?


10

সরল ইংরেজী ভাষায়: আমার একাধিক রিগ্রেশন বা আনোভা মডেল রয়েছে তবে প্রতিটি ব্যক্তির প্রতিক্রিয়া পরিবর্তনশীল হ'ল সময়ের একটি বক্ররেখা function

  • বাঁকগুলির আকার বা উল্লম্ব অফসেটগুলির মধ্যে তাত্পর্যপূর্ণ পার্থক্যের জন্য ডান হাতের পার্শ্বের কোন ভেরিয়েবল দায়ী তা আমি কীভাবে বলতে পারি?
  • এটি কি সময়-সিরিজের সমস্যা, পুনরাবৃত্ত-পরিমাপের সমস্যা, বা অন্য কোনও কিছু?
  • এই জাতীয় ডেটা বিশ্লেষণের জন্য সেরা-অনুশীলনগুলি কী (সবচেয়ে ভাল Rতবে আমি অন্যান্য সফ্টওয়্যার ব্যবহারের জন্য উন্মুক্ত)?

আরও সুনির্দিষ্ট পদে: ধরা যাক আমার কাছে মডেল আছে y i j k = β 0 + β 1 x i + β 2 x j + β 3 x i x j + ϵ k তবে আসলে একই স্বতন্ত্র থেকে বহু সময়-পয়েন্ট সংগ্রহ করা পয়েন্টগুলি , যা একটি সংখ্যার ভেরিয়েবল হিসাবে রেকর্ড করা হয়েছিল। ডেটা বোঝা যায় যে প্রতিটি পৃথকYআমি=β0+ +β1এক্সআমি+ +β2এক্স+ +β3এক্সআমিএক্স+ +εYআমিটিYআমিটিসময়ের একটি চতুষ্কোণ বা চক্রাকারীয় ক্রিয়াকলাপ যার উল্লম্ব অফসেট, আকৃতি, বা ফ্রিকোয়েন্সি (চক্রাকার ক্ষেত্রে) উল্লেখযোগ্যভাবে কোভেরিয়েটের উপর নির্ভর করে। কোভেরিয়েটগুলি সময়ের সাথে পরিবর্তিত হয় না - অর্থাত্ কোনও ব্যক্তির ডেটা সংগ্রহের সময়কালের জন্য ধ্রুবক শরীরের ওজন বা চিকিত্সার গ্রুপ থাকে।

এখন পর্যন্ত আমি নিম্নলিখিত Rপদ্ধতির চেষ্টা করেছি :

  1. Manova

    Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME); 
    

    ... YTএমন একটি ম্যাট্রিক্স যেখানে কলামগুলি সময় পয়েন্ট, তার মধ্যে এই উদাহরণে 10 টি, তবে আসল তথ্যগুলিতে অনেক বেশি।

    সমস্যা: এটি সময়কে একটি ফ্যাক্টর হিসাবে বিবেচনা করে তবে সময়-পয়েন্টগুলি প্রতিটি ব্যক্তির সাথে হুবহু মিলে না। তদুপরি, তাদের মধ্যে অনেকগুলি নমুনার আকারের সাথে তুলনামূলক রয়েছে যাতে মডেলটি স্যাচুরেটেড হয়। দেখে মনে হচ্ছে সময়ের সাথে সাথে প্রতিক্রিয়ার ভেরিয়েবলের আকারটি উপেক্ষা করা হচ্ছে।

  2. মিশ্র-মডেল (পিনহিরো এবং বেটসের মতো, এস এবং এস প্লাসে মিশ্র প্রভাব প্রভাব )

    lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, 
        random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
    

    ... IDএমন একটি উপাদান যেখানে পৃথকভাবে ডেটা বিভক্ত হয়। এই উদাহরণে প্রতিক্রিয়া সময়ের সাথে সাথে চক্রীয়, তবে পরিবর্তে চতুর্ভুজ পদ বা সময়ের অন্যান্য ক্রিয়াকলাপ হতে পারে।

    সমস্যা: প্রতিটি সময়কাল প্রয়োজনীয় (বিশেষত চতুষ্পদ শর্তাবলীর জন্য) এবং কোনটি কোভারিয়েট দ্বারা প্রভাবিত হয় তা আমি নিশ্চিত নই।

    • stepAIC()এগুলি নির্বাচনের জন্য কি কোনও ভাল পদ্ধতি?
    • যদি এটি কোনও সময়-নির্ভর শব্দটিকে সরিয়ে দেয় তবে এটিও randomযুক্তি থেকে এটি সরিয়ে দেবে ?
    • আমি যদি একটি স্বতঃসংশোধন ফাংশনও ব্যবহার করি (যেমন corEXP()) তর্কটিতে একটি সূত্র গ্রহণ করে - তবে correlationকি আমাকে সেই সূত্রটি তৈরি করা উচিত যা কেবলমাত্র corEXP()হিসাবে randomবা একই হিসাবে রয়েছে ~1|ID?
    • nlmeপ্যাকেজ খুব কমই সময় সিরিজ বাহিরে Pinheiro এবং বেটস প্রেক্ষাপটে উল্লেখ করা হয় ... এটা ভাল এই সমস্যার উপযুক্ত বিবেচনা করা হয় না?
  3. প্রতিটি ব্যক্তির জন্য একটি চতুষ্কোণ বা ত্রিকোণমিতিক মডেল ফিট করে এবং তারপরে প্রতিটি সহগকে একাধিক রিগ্রেশন বা আনোভা হিসাবে প্রতিক্রিয়া পরিবর্তনশীল হিসাবে ব্যবহার করে।

    সমস্যা: একাধিক তুলনা সংশোধন প্রয়োজনীয়। অন্য কোনও সমস্যার কথা ভাবতে পারি না যা আমার সন্দেহজনক করে তোলে যে আমি কিছু উপেক্ষা করছি।

  4. যেমন আগে এই সাইটে পরামর্শ দেওয়া হয়েছিল ( একাধিক পূর্বাভাসকর সাথে থাকা টাইম সিরিজ রিগ্রেশনটির শব্দটি কী? ) এখানে রয়েছে আরিম্যাক্স এবং ট্রান্সফার ফাংশন / ডায়নামিক রিগ্রেশন মডেল

    সমস্যা: এআরএমএ ভিত্তিক মডেলগুলি বিচ্ছিন্ন সময় ধরে, তাই না? গতিশীল প্রতিরোধের বিষয়ে, আমি আজ প্রথমবারের মতো এটি সম্পর্কে শুনেছি, তবে আমি আর একটি নতুন পদ্ধতি আবিষ্কার করার আগে যেটি সম্ভবত শেষ হতে পারে না, আমি ভেবেছিলাম পরামর্শের আগে যারা এই কাজটি করেছেন তাদের জিজ্ঞাসা করা বুদ্ধিমানের হবে।


5
@ f1r3br4 এবং আপনি যদি আপনার ডেটা ঠিক কী সম্পর্কে কিছু বিশদ যুক্ত করেন তবে এটি সাহায্য করতে পারে? অর্থাৎ কতটি সময় পয়েন্টে কতগুলি কেস পরিমাপ করা হয়? কেসগুলি বিভিন্ন অবস্থায় রয়েছে? বা অন্য কিছু?
জেরোমি অ্যাংলিম

আপনি কি আপনার অ্যাকাউন্ট হারিয়েছেন? যদি তা হয় তবে দয়া করে নতুন একটি নিবন্ধ করুন, সম্ভবত আপনার জিমেইল ঠিকানার সাথে যাতে আমি সহজেই কী সংযোজিত হবে তা খুঁজে পেতে পারি।

1
@ f-tussel এবং @ jeromy-anglim: তথ্যগুলি প্রাকৃতিক জীবনকালীন সময়ে ল্যাব প্রাণীর কাছ থেকে সংগ্রহ করা বিভিন্ন অ-আক্রমণাত্মক পরিমাপ, প্রায়শই জিনোটাইপ, লিঙ্গ বা তাদের খাওয়ানোর মতো ধরণের তথ্যের সাথে মিলিত হয়। 'অনেকগুলি' পয়েন্ট বলতে আমার অর্থ 20 থেকে কয়েক শতাধিক। এটি কেবলমাত্র একটি ডেটা সেট নয় যা আমি বিশ্লেষণ করার চেষ্টা করছি, তবে কীভাবে আমার গ্রুপে প্রচলিত হয়ে উঠছে এমন এক ধরণের ডেটা বিশ্লেষণ করতে শিখতে। গ্রুপ-গ্রুপের সাথে মিশ্রিত মডেলগুলি কেবলমাত্র ছোট ছোট নমুনার আকারের জন্য সুপারিশ করা হয়?
f1r3br4nd

উত্তর:


5

জেরোমি অ্যাংলিম যেমন বলেছিলেন, এটি প্রতিটি ব্যক্তির জন্য আপনার কত সময় পয়েন্ট রয়েছে তা জানতে সহায়তা করবে; যেমনটি আপনি "অনেক" বলেছিলেন আমি উদ্যোগ নিয়েছিলাম যে কার্যকরী বিশ্লেষণ একটি কার্যকর বিকল্প হতে পারে। আপনি আর প্যাকেজ এফডিএ যাচাই করতে চাইতে পারেন এবং র‌্যামসে এবং সিলভারম্যানের বইটি দেখতে পারেন


কার্যকরী বিশ্লেষণ দীর্ঘমেয়াদে আশাব্যঞ্জক বলে মনে হচ্ছে, তবে আমি বিশ্বাস করি যে আমি অর্থহীন বা পক্ষপাতদুষ্ট ফলাফল পাচ্ছি না তার আগে মনে হচ্ছে এখানে বেশ কিছু শেখার বক্রতা উপস্থিত থাকবে। সুতরাং আমি যখন এই গতিতে উঠছি, তখন কি আরও পরিচিত- nlmeভিত্তিক পদ্ধতিগুলি (ওপিতে আইটেম 2 এবং 3) আপাতত ডেটা ব্যবহারের জন্য বৈধ?
f1r3br4nd

2

মূলত এই প্রশ্নটি উত্থাপন করার পরে, আমি এই সিদ্ধান্তে পৌঁছেছি যে র্যান্ডম ব্লকিং ফ্যাক্টর হিসাবে বিষয়যুক্ত মিশ্র-প্রভাব মডেলগুলি এই সমস্যাটির ব্যবহারিক সমাধান, অর্থাৎ আমার মূল পোস্টে বিকল্প # 2। যদি randomযুক্তিতে lmeসেট করা থাকে ~1|ID(যেখানে IDএকই পরীক্ষার বিষয় থেকে আগত পর্যবেক্ষণগুলি চিহ্নিত করে) তবে একটি এলোমেলো ইন্টারসেপ্ট মডেল লাগানো হবে। যদি এটি সেট করা থাকে ~TIME|IDতবে একটি এলোমেলো slাল এবং ইন্টারসেপ্ট মডেল লাগানো হবে। একই স্বতন্ত্রের মধ্যে পরিবর্তিত ভেরিয়েবল যুক্ত যে কোনও ডান পার্শ্বযুক্ত সূত্রটি এবং ~এবং এর মধ্যে স্থাপন করা যেতে পারে |ID, তবে অতিরিক্ত জটিল সূত্রগুলির ফলে একটি স্যাচুরেটেড মডেল এবং / বা বিভিন্ন সংখ্যাসূচক ত্রুটি দেখা দেয়। সুতরাং, কেউ সম্ভাবনা অনুপাত পরীক্ষা ব্যবহার করতে পারেন (anova(myModel, update(myModel,random=~TIME|ID))) এলোমেলো interালু এবং ইন্টারসেপ্ট মডেল বা অন্যান্য প্রার্থীর এলোমেলো প্রভাব মডেলগুলির সাথে একটি এলোমেলো ইন্টারসেপ্ট মডেলটির তুলনা করতে। ফিটের পার্থক্যটি যদি তাৎপর্যপূর্ণ না হয় তবে সহজ মডেলের সাথে লেগে থাকুন। আমার মূল পোস্টে এলোমেলো ট্রিগ ফাংশনে যাওয়া আমার পক্ষে ওভারকিল ছিল।

আমি উত্থাপিত অন্যান্য সমস্যাটি ছিল মডেল নির্বাচনের একটি। দেখে মনে হচ্ছে যে কোনওরকমের মডেল নির্বাচন পছন্দ করেন না, তবে কারওরই ব্যবহারিক বিকল্প নেই। আপনি যদি গবেষককে অন্ধভাবে বিশ্বাস করেন যিনি ব্যাখ্যাযোগ্য পরিবর্তনশীলগুলি কী এবং প্রাসঙ্গিক নয় সে সম্পর্কিত ডেটা সংগ্রহ করেছেন তবে আপনি প্রায়শই অন্ধভাবে তাদের অনির্ধারিত অনুমানগুলি গ্রহণ করবেন accepting আপনি যদি প্রতিটি সম্ভাব্য বিটটি অ্যাকাউন্টে গ্রহণ করেন তবে আপনি প্রায়শই একটি স্যাচুরেটেড মডেল দিয়ে শেষ করবেন। আপনি যদি ইচ্ছামত কোনও নির্দিষ্ট মডেল এবং ভেরিয়েবলগুলি সহজেই বেছে নেন কারণ এগুলি সহজ, আপনি এবার নিজের অন্বেষিত অনুমানগুলি গ্রহণ করবেন।

সুতরাং, সংক্ষেপে বলা যায়, বার বার ব্যবস্থা জন্য এটা lmeমডেলের মাধ্যমে ছাঁটাই দ্বারা অনুসরণ MASS:::stepAICবা MuMIn:::dredgeএবং / অথবা nlme:::anova.lmeযতক্ষণ না কেউ একটি ভালো ধারণা আছে।

কারও কোনও খণ্ডন আছে কিনা তা দেখার জন্য আমি এটি স্বীকার করে নেওয়ার আগে কিছুক্ষণ রেখে দেব। আপনার সময়ের জন্য ধন্যবাদ, এবং আপনি যদি এটি পড়ছেন কারণ আপনার কাছে আমার একই ধরণের প্রশ্ন রয়েছে, ভাগ্য ভাল এবং অর্ধ-অচেতন অঞ্চলটিতে আপনাকে স্বাগতম।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.