চ্যালেঞ্জিং ডেটা সেটটির জন্য কোন মডেল? (প্রচুর বাসা সহ শত শত সিরিজ)


9

বিশ্লেষণের জন্য আমার কাছে বেশ জটিল একটি ডেটা সেট রয়েছে এবং আমি এর পক্ষে একটি ভাল সমাধান খুঁজে পাচ্ছি না।

জিনিসটি এখানে:

1. কাঁচা তথ্য মূলত পোকামাকড় গানের রেকর্ডিং। প্রতিটি গান বেশ কয়েকটি বিস্ফোরিত এবং প্রতিটি ফর্ম সাব-ইউনিট দিয়ে তৈরি। সমস্ত ব্যক্তি 5 মিনিটের জন্য রেকর্ড করা হয়েছে। বিস্ফোরণের সংখ্যা এবং রেকর্ডিংয়ে তাদের অবস্থান ব্যক্তিদের মধ্যে খুব আলাদা হতে পারে, পাশাপাশি ফেটে প্রতি উপ-ইউনিটের সংখ্যাও।

২. আমার প্রতিটি উপ-ইউনিটের ক্যারিয়ার ফ্রিকোয়েন্সি (মৌলিক ফ্রিকোয়েন্সি) রয়েছে এবং আমি এটি বিশ্লেষণ করতে চাই।

আমার সমস্যাগুলি:

1. একটি বিস্ফোরণের মধ্যে ফ্রিকোয়েন্সিগুলি স্পষ্টতই স্বাধীন নয় (যদিও এটি বেশ স্থিতিশীল, তবে উপ-ইউনিট এন -1 এর ফ্রিকোয়েন্সিটি উপ-ইউনিট এনের উপর প্রভাব ফেলবে)।

২. বিস্ফোরণগুলি একটি রেকর্ডিংয়ের মধ্যেও স্বাধীন নয়।

৩. সময়ের সাথে সাথে ফ্রিকোয়েন্সি হ্রাস হওয়ায় এগুলি আরও স্বতন্ত্র হয় (গানের ফ্রিকোয়েন্সি কম ও কম হওয়ার সাথে সাথে ব্যক্তি গাইতে ক্লান্ত হয়ে পড়ে)। ড্রপিং লিনিয়ার বলে মনে হচ্ছে

৪. নীড়সংশ্লিষ্ট = আমার কাছে এ এবং বি এর দুটি অবস্থানের জন্য 3 জন প্রতিলিপি রয়েছে So সুতরাং আমার কাছে এ 1, এ 2, এ 3 এবং বি 1, বি 2, বি 3 রয়েছে।

আমি কি করতে চাই:

1. আমার দুটি অবস্থানের মধ্যে ফ্রিকোয়েন্সি পার্থক্য চিহ্নিত করুন (এটি পরিসংখ্যানগতভাবে পরীক্ষা করুন)

২. দুটি জায়গার মধ্যে ফ্রিকোয়েন্সি হ্রাসের বৈশিষ্ট্য চিহ্নিত করুন (এটিগুলির মধ্যে একটিতে এটি দ্রুত নেমে যায় কিনা দেখুন)

এটা কিভাবে করতে হবে:

ওয়েল এজন্যই আমার সাহায্য দরকার: আমি জানি না। দেখে মনে হয় যে আমার ক্ষেত্রে এমন সমস্যাগুলির সংমিশ্রণ ঘটে যা সাধারণত একসাথে দেখা যায় না। আমি মিশ্র মডেলগুলি সম্পর্কে, জিএএম সম্পর্কে, আরিমা সম্পর্কে, এলোমেলো এবং স্থির প্রভাবগুলি পড়েছি তবে এটি করার সর্বোত্তম উপায় সম্পর্কে আমি সত্যিই নিশ্চিত হতে পারি না। আমি যখন এটি গ্রাফ করি (ফ্রিকোয়েন্সি ~ সাব-ইউনিট নম্বর এন ), তখন দুটি অবস্থানের মধ্যে পার্থক্যটি খুব স্পষ্ট। তাপমাত্রা (ফ্রিকোয়েন্সি উচ্চতর করে তোলে) ইত্যাদির মতো আমাকেও অন্যান্য ভেরিয়েবলগুলি অ্যাকাউন্টে নিতে হবে etc.

আমি ভাবছিলাম:

  • প্রতিরূপের মধ্যে থাকা ব্যক্তিদের তাদের কাছ থেকে নেস্ট করা এবং অবস্থানটির মধ্যে প্রতিলিপি তৈরি (স্বতন্ত্র / প্রতিলিপি / অবস্থান) est

  • একটি এলোমেলো 'বিস্ফোরণ' প্রভাব ব্যবহার করুন, তাই আমি প্রতিটি বিস্ফোরণের মধ্যে পরিবর্তনশীলতার বিষয়টি বিবেচনা করি।

  • ফ্রিকোয়েন্সি ড্রপিং পরিমাপ করতে (রেকর্ডিংয়ে ব্রাস্ট পজিশন) প্রভাব ব্যবহার করুন (আশা করি এটি আসলে রৈখিক)।

এটা কি সঠিক হবে?

এই ধরণের দৃশ্যের জন্য আমি কি বিশেষ ধরণের মডেল ব্যবহার করতে পারি?


জো এই সাইটে আপনাকে স্বাগতম। আপনার পোস্টে সাইন ইন করার দরকার নেই, আপনার নামটি সর্বদা আপনার
মহাকর্ষের

ঠিক আছে, এবং ধন্যবাদ! এটি একটি খুব সুন্দর ওয়েবসাইট, খুব সুন্দরভাবে তৈরি।
জো

"অনুলিখিত ফর্মগুলির সাথে তুলনা করা হলে" প্রতিলিপিটির মধ্যে থাকা ব্যক্তিদের তাদের কাছ থেকে নেওয়া, এবং স্থানটির মধ্যে প্রতিলিপিটি বাসা বাঁধতে (স্বতন্ত্র / প্রতিলিপি / অবস্থান) "ভাল ধারণা বলে মনে হয়। আপনার ছয়টি উপ-জনগোষ্ঠীর একটি স্বল্প দেখতে কেমন?
Fr.

1
আপনার উত্তরের জন্য আপনাকে অনেক ধন্যবাদ, সত্যই এটি প্রশংসা। ঠিক আছে, এটি আমাকে দীর্ঘ সময় নিয়েছে, তবে আমি এটি (রক্তাক্ত) ডেটাসেট বিশ্লেষণ করতে সক্ষম হয়েছি। আমি মনে করি খুব উচ্চাভিলাষী ছিলাম, একই সাথে সবকিছুকে মডেল করতে চাই। তাই আমি প্রতিটি সমস্যার জন্য (বেশিরভাগ গড় ফ্রিকোয়েন্সি পার্থক্য, ফ্রিকোয়েন্সি বৃদ্ধি ইত্যাদি) বিভিন্ন মডেলগুলিতে কাজের মধ্যে বিভক্ত হয়েছি। উপসংহার: কখনও কখনও কাজ বিভক্ত করা ভাল!
জো

উত্তর:


2

এটি কেবলমাত্র কয়েকটি সাধারণ পরামর্শ যা আপনাকে সহায়ক হিসাবে খুঁজে পেতে পারে, কোনও রেসিপির চেয়ে আরও একটি রোডম্যাপ।

  • আমার প্রবৃত্তিটি একটি বায়সিয়ান হায়ারারিকিকাল মডেল তৈরি করা হবে, কারণ এটি নিজেকে পুনরাবৃত্ত মডেল বিকাশের জন্য ndsণ দেয় - আমি মনে করি না যে আপনি এমন একটি বিদ্যমান মডেল পাবেন যাতে আপনার পরে সমস্ত ঘণ্টা এবং হুইসেল রয়েছে। তবে এটি হাইপোথিসিসের পরীক্ষা আরও শক্ত করে তোলে, আপনার পক্ষে অনুমানের পরীক্ষাটি কতটা প্রয়োজনীয় তা আমি জানি না।
  • মনে হচ্ছে কীটপতঙ্গগুলি কীভাবে আচরণ করে সে সম্পর্কে আপনার মাথায় কিছুটা অনানুষ্ঠানিক মডেল পেয়েছেন; আপনি "ক্লান্ত হয়ে পড়ার মতো" কথা বলছেন এবং আপনি জানেন যে তাপমাত্রাটি ফ্রিকোয়েন্সি আরও বাড়িয়ে তোলে সম্ভবত সম্ভবত প্রাণীর আরও শক্তি আছে বলে। দেখে মনে হচ্ছে কীভাবে কীটপতঙ্গগুলি কীভাবে তাদের গান তৈরি করে সে সম্পর্কে আপনার মনে একটু জেনারেটরি মডেল পেয়েছেন।
  • "এক শটে" মডেল করার ক্ষেত্রে সমস্যাটি খুব জটিল বলে মনে হচ্ছে। আমি মনে করি আপনাকে কিছু তৈরি করতে হবে পিসমিল। আমি কিছু "শক্তিশালী সরল অনুমান" দিয়ে শুরু করব - অর্থাত্‍, ডেটাসেটের বেশিরভাগ জটিলতাটি পরে ফেলে দেবো, যখন আপনি একটি সাধারণ মডেল পেয়েছিলেন যা পরে এটি আবার যুক্ত করার পরিকল্পনা নিয়ে।

সুতরাং শুরু করার জন্য, আমি একটি ফেট-বাই-ফাটার ভিত্তিতে সাব-ইউনিট ফ্রিকোয়েন্সিগুলি প্রিড্রোসেসের মতো কিছু করতে চাই (অর্থাত্ ফ্রিকোয়েন্সি, ফ্রিকোয়েন্সি ট্রেন্ড) জোড়ার মতো - ওএলএস দিয়ে এটি করুন, এবং কেবলমাত্র ফ্রিকোয়েন্সি গড় এবং প্রবণতার মডেল করুন একটি ফেটে বরং সাব-ইউনিটগুলি নিজেরাই। বা আপনি কী করতে পারেন (অর্থাত্, প্রবণতা, উপ-ইউনিটগুলির #), যদি সাবুনিটের সংখ্যা কীটপতঙ্গটি কীভাবে ক্লান্ত হচ্ছে তার সাথে সম্পর্কিত। তারপরে একটি বায়সিয়ান হায়ারারিকিকাল মডেল তৈরি করুন যেখানে ফেটে গড় এবং প্রবণতার বন্টন গড়, রেকর্ডিংয়ের প্রবণতা দ্বারা নির্ধারিত হয় এবং পরিবর্তে এটি অবস্থানের গড়, প্রবণতা দ্বারা নির্ধারিত হয়।

তারপরে রেকর্ডিং গড় / প্রবণতার জন্য একটি উপাদান হিসাবে তাপমাত্রা যুক্ত করুন।

এই সাধারণ মডেলটি আপনাকে তাপমাত্রা এবং অবস্থান দ্বারা নির্ধারিত কোনও রেকর্ডিংয়ে পৃথক বিস্ফোরণের গড় এবং প্রবণতাটি দেখতে দেয়। চেষ্টা করুন এবং এটি কাজ করতে পেতে।

তারপরে আমি অবস্থান এবং রেকর্ডিংয়ের দ্বারা নির্ধারিত ভেরিয়েবল হিসাবে যুক্ত করে বিস্ফোরণের গড় ফ্রিকোয়েন্সি (বা প্রবণতা, বার্সার মধ্যে শান্ত সময়কে ভাগ করে) এর মধ্যে পার্থক্যটি অনুমান করার চেষ্টা করব। পরবর্তী পদক্ষেপটি একটি রেকর্ডিংয়ের মধ্যে বিস্ফোরণ গড়ার একটি এআর মডেল।

বিসর্গের প্রকৃতি সম্পর্কে কিছু প্রিয়ার এবং কিছু খুব দৃ strong় অনুমান দেওয়া (যে সমস্ত তথ্য গড় এবং প্রবণতার দ্বারা দেওয়া হয়েছে), এই প্রাথমিক মডেলটি আপনাকে বলবে:

  • স্থান অনুসারে আলাদাভাবে ফেটে ফেলার ফর্মুলিটি কীভাবে এবং অস্থায়ীভাবে temp
  • কীভাবে অভ্যন্তরীণ-বিস্ফোরণটি স্থান অনুসারে আলাদা হয় এবং অস্থায়ীভাবে টেম্পোর করে
  • কীভাবে বাইরের-বিস্ফোরণটি স্থান অনুসারে আলাদা এবং স্থানীয়ভাবে অস্থায়ী হয়

একবার আপনি এইরকম কাজ করার জন্য কিছু পেয়ে গেলে তারপরে উপ-ইউনিটগুলি নিজেরাই মডেল করার এবং মূল ওএলএসের প্রাক্কলনটি ফেলে দেওয়ার সময় আসতে পারে। আমি কী ধরনের টাইম-সিরিজ মডেল ফিট করতে পারি তার ধারণা পেতে এই মুহুর্তে ডেটাটি দেখব এবং টাইম-সিরিজের মডেলের পরামিতিগুলি (মানে, ট্রেন্ড) জোড়ার পরিবর্তে মডেল করব।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.