আমার কাছে ডেটা সেট রয়েছে যা অনেকগুলি বৈশিষ্ট্যের মধ্যে, জিপিএস স্থানাঙ্ক (অক্ষাংশ এবং দ্রাঘিমাংশ) থাকে। আমি সমস্যাগুলি অন্বেষণ করতে এই ডেটা সেটগুলি ব্যবহার করতে চাই: (1) শুরু এবং শেষ পয়েন্টগুলির মধ্যে ড্রাইভের জন্য ইটিএ গণনা করা; এবং (২) একটি নির্দিষ্ট পয়েন্টের জন্য অপরাধের পরিমাণ অনুমান করা।
আমি লিনিয়ার রিগ্রেশন মডেলটি ব্যবহার করতে চাই। তবে, আমি কি এই জিপিএস স্থানাঙ্কগুলি সরাসরি লিনিয়ার মডেলটিতে ব্যবহার করতে পারি?
অক্ষাংশ এবং দ্রাঘিমাংশে কোনও ব্যক্তির বয়সের মতো অর্ডিনাল সম্পত্তি থাকে না । উদাহরণস্বরূপ, দুটি পয়েন্ট (40.805996, -96.681473) এবং (41.226682, -95.986587) এর কোনও অর্থবহ অর্ডিং আছে বলে মনে হয় না। তারা মহাকাশ মাত্র পয়েন্ট। আমি তাদের বিশিষ্ট মার্কিন জিপ কোডগুলির সাথে প্রতিস্থাপন এবং তারপরে এক-হট এনকোডিং করার কথা ভাবছিলাম , তবে এর ফলে প্রচুর ভেরিয়েবল আসবে ।