আমি এয়ারলাইন্সের দাম নির্ধারণের আচরণটি তদন্ত করতে চাই - বিশেষত বিমান সংস্থা প্রতিযোগীদের মূল্য নির্ধারণে কীভাবে প্রতিক্রিয়া দেখায়।
যেহেতু আমি বলতে চাই আরও জটিল বিশ্লেষণ সম্পর্কে আমার জ্ঞানটি যথেষ্ট সীমাবদ্ধ আমি তথ্যের সামগ্রিক দৃষ্টিভঙ্গি সংগ্রহ করার জন্য বেশিরভাগ মৌলিক পদ্ধতিই করেছি। এর মধ্যে সাধারণ গ্রাফ রয়েছে যা ইতিমধ্যে অনুরূপ নিদর্শনগুলি সনাক্ত করতে সহায়তা করে। আমি এসএএস এন্টারপ্রাইজ 9.4 ব্যবহার করছি।
তবে আমি আরও একটি সংখ্যা ভিত্তিক পদ্ধতির সন্ধান করছি।
ডেটা সেট
আমি (স্ব) সংগ্রহ করা ডেটা সেট ব্যবহার করছি তার মধ্যে প্রায় ~ 54.000 ভাড়া রয়েছে। সমস্ত ভাড়া প্রতিদিন basis০ দিনের সময় উইন্ডোর অভ্যন্তরে সংগ্রহ করা হত (প্রতি রাতে 00:00 এ)।
তাই, সেই সময় উইন্ডোর মধ্যে যে ভাড়া ঘটে , ভাড়া প্রাপ্যতা সেইসাথে ফ্লাইটের প্রস্থানের তারিখ থেকে বার বিষয় যখন এটি ভাড়া সংগ্রহ তারিখ অনুসারে পাস করা হয়েছে। (ফ্লাইটের প্রস্থানের তারিখ অতীতে হলে আপনি কোনও ফ্লাইটের জন্য ভাড়া সংগ্রহ করতে পারবেন না)
মূলত: এর মতো দেখতে অপ্রত্যাশিত: (জাল তথ্য)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
"DaysBeforeDeparture" প্রক্রিয়ার মাধ্যমে গণনা করা হয় যেখানে
- আমি এবং অন্তর (প্রস্থানের আগের দিন)
- ভাড়া ও বিমানের তারিখ (বিমানের যাত্রা)
- সি ও তারিখ যার ভাড়া আদায় করা হয়েছিল
আমি (ডেসবিয়ারডেপ।) (জাল ডেটা!) দ্বারা সেট করা গোষ্ঠীভুক্ত ডেটার উদাহরণ এখানে রয়েছে:
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
এতদূর যা নিয়ে এসেছি
লাইন গ্রাফগুলি দেখে আমি ইতিমধ্যে অনুমান করতে পারি যে বেশ কয়েকটি লাইনের একটি উচ্চতর সম্পর্কযুক্ত কারণ রয়েছে। অতএব, আমি প্রথমে গোষ্ঠীযুক্ত ডেটাতে পারস্পরিক সম্পর্ক বিশ্লেষণ ব্যবহার করার চেষ্টা করেছি। কিন্তু এটি কি সঠিক উপায়? মূলত আমি এখন ব্যক্তিগত পরিবর্তে গড়ের সাথে পারস্পরিক সম্পর্ক স্থাপনের চেষ্টা করি? অন্য কোন উপায় আছে?
দামগুলি কোনও রৈখিক আকারে সরে না যায় এবং অ-রৈখিক হিসাবে প্রদর্শিত না হওয়ায় আমি নিশ্চিত, কোন রেগ্রেশন মডেলটি এখানে ফিট করে। আমি কি কোনও বিমানের প্রতিটি দামের বিকাশের জন্য একটি মডেল ফিট করতে চাই?
পিএস: এটি একটি দীর্ঘ পাঠ্য প্রাচীর। আমার যদি কিছু পরিষ্কার করার দরকার হয় তবে আমাকে জানান। আমি এই সাব নতুন।
কেউ কি একটি সূত্র? :-)