জিপিএস স্থানাঙ্ক (অক্ষাংশ এবং দ্রাঘিমাংশ) কোনও লিনিয়ার মডেলের বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে?


10

আমার কাছে ডেটা সেট রয়েছে যা অনেকগুলি বৈশিষ্ট্যের মধ্যে, জিপিএস স্থানাঙ্ক (অক্ষাংশ এবং দ্রাঘিমাংশ) থাকে। আমি সমস্যাগুলি অন্বেষণ করতে এই ডেটা সেটগুলি ব্যবহার করতে চাই: (1) শুরু এবং শেষ পয়েন্টগুলির মধ্যে ড্রাইভের জন্য ইটিএ গণনা করা; এবং (২) একটি নির্দিষ্ট পয়েন্টের জন্য অপরাধের পরিমাণ অনুমান করা।

আমি লিনিয়ার রিগ্রেশন মডেলটি ব্যবহার করতে চাই। তবে, আমি কি এই জিপিএস স্থানাঙ্কগুলি সরাসরি লিনিয়ার মডেলটিতে ব্যবহার করতে পারি?

অক্ষাংশ এবং দ্রাঘিমাংশে কোনও ব্যক্তির বয়সের মতো অর্ডিনাল সম্পত্তি থাকে না । উদাহরণস্বরূপ, দুটি পয়েন্ট (40.805996, -96.681473) এবং (41.226682, -95.986587) এর কোনও অর্থবহ অর্ডিং আছে বলে মনে হয় না। তারা মহাকাশ মাত্র পয়েন্ট। আমি তাদের বিশিষ্ট মার্কিন জিপ কোডগুলির সাথে প্রতিস্থাপন এবং তারপরে এক-হট এনকোডিং করার কথা ভাবছিলাম , তবে এর ফলে প্রচুর ভেরিয়েবল আসবে ।


1
এগুলি কি সরাসরি ব্যবহার করতে হবে ? আপনি কি জোনিং সরঞ্জাম সম্পর্কে শুনেছেন, যেমন এস ওপেনশোর এজেডপি অ্যালগরিদম? এমনকি অঞ্চলটি তুলনামূলকভাবে সামঞ্জস্যপূর্ণ থাকলে আপনি অঞ্চলগুলিকে পৃথক পৃথক অঞ্চল / অঞ্চলগুলিতে মানচিত্রে অঞ্চলগুলি সীমাবদ্ধ করতে পারেন।
মফি 21

@ মফি: তার মানে আমি লাত / লম্বা জোনে রূপান্তর করব, তাই না? তবে তারপরে আমার কাছে কয়েক হাজার বা হাজার হাজার শ্রেণিবদ্ধ জোন থাকবে ঠিক যেমন জিপ কোডগুলির সাথে। আমি তাদের সকলকে এক-গরম এনকোড করতে চাই।
stackoverflowuser2010

অবশ্যই আপনি অঞ্চলগুলি কীভাবে কাটাবেন তার উপর নির্ভর করে। আপনি যদি "নিরক্ষীয় রেখার দক্ষিণে / নিরক্ষীয় রেখার উত্তরে" বেছে নেন, তবে এটি মাত্র দুটি। অনেক জোনিং অ্যালগরিদমগুলিতে জোনের সংখ্যা বা ন্যূনতম জোনের আকারের মতো পরিমাণগুলি নির্ধারণ করতে কিছু হাইপার-প্যারামিটার থাকে।
Mephy

আমার একই সমস্যা আছে I আমি মানুষের অবস্থান সম্পর্কে ভবিষ্যদ্বাণী করতে চাই। প্রশিক্ষণের ডেটাতে আমি সমস্ত ভূ-অবস্থান বৈশিষ্ট্য জিওহ্যাশ করেছি। এর পরে, লেবেলডেকোডারটি শ্রেণিবদ্ধ অবস্থানের বৈশিষ্ট্যটিকে রূপান্তর করতে ব্যবহৃত হয়। শেষ পর্যন্ত ফলাফলটি ভয়াবহ। স্থানিক পূর্বাভাস মোকাবেলার জন্য কি কোনও ভাল ধারণা আছে?
berisfu

উত্তর:


5

আপনি এগুলিকে সরাসরি ব্যবহার করতে পারবেন না, কারণ সত্যিকারের রৈখিক সম্পর্ক হওয়ার সম্ভাবনা কম, যদি না আপনি "পূর্ব বা উত্তরের" কতটা দূরের কথা ভবিষ্যদ্বাণী করতে চান না। মন্তব্যে উল্লিখিত হিসাবে, আপনার এগুলিকে জোনে রূপান্তর করা দরকার। যদি আপনি এটি সত্যিই সহজ রাখতে চান, আপনি একটি কম সংখ্যক সম্ভাব্য ক্লাস্টার সহ একটি কেএনএন ক্লাস্টারিং অ্যালগরিদম ব্যবহার করতে পারেন এবং তারপরে প্রতিটি উদাহরণকে ক্লাস্টার আইডি সহ একটি নতুন বৈশিষ্ট্য নির্ধারণ করতে পারেন, এবং তারপরে একটি-গরম এনকোড।

আপনি কীভাবে লোকেরা পুরো মানচিত্রের মানগুলির পূর্বাভাস দেওয়ার জন্য স্থানাঙ্ককে বিভক্ত করে সে সম্পর্কে পড়তে চাইতে পারেন। প্রথম উদাহরণটি তাপমাত্রা কেন্দ্রগুলি সহ, তবে আপনি এটি অপরাধের জন্য "হট অঞ্চল" হিসাবে কল্পনাও করতে পারেন।

( ডকস )


2

আপনি আপনার হৃদয় যা ইচ্ছা তা করতে পারেন তবে আপনার মডেলটি তাপমাত্রা বা সময়ের পার্থক্য সম্পর্কে পূর্বাভাস না দিলে আমি অন্য কোনও টার্গেট ভেরিয়েবল নিয়ে আসতে পারি না যা কেবলমাত্র স্থানাঙ্কের উপর নির্ভর করে।

আপনি সম্ভবত যা করতে চান তা হ'ল একটি বাহ্যিক ডেটা উত্স ব্যবহার করা এবং দেশ / জিপ কোড / জলবায়ু / অন্যান্য ভৌগলিক বৈশিষ্ট্যগুলি দিয়ে আপনার ডেটা সমৃদ্ধ করুন যা আপনার মডেলটিকে সম্পাদন করতে সহায়তা করবে।


0

জিপিএস স্থানাঙ্কগুলি সরাসরি জিওহ্যাশে রূপান্তর করা যায় । জিওহ্যাশ অঙ্কের সংখ্যার ভিত্তিতে পৃথক পৃথক আকারের "বালতি "গুলিতে পৃথক করে (সংক্ষিপ্ত জিওহ্যাশ কোডগুলি ছোট অঞ্চলগুলির জন্য বড় অঞ্চল এবং দীর্ঘতর কোড তৈরি করে)।

জিওহ্যাশ এমন একটি একক সংখ্যা যা কোনও মডেলের বৈশিষ্ট্য হিসাবে ব্যবহার করা যেতে পারে।

জিওহ্যাশ কেবল পুরো পৃথিবীতেই প্রযোজ্য, জিপকোড দেয় না।


জিওশারের আউটপুট একটি স্ট্রিং, একক সংখ্যা নয়, তাই না? এবং যদি জিওহ্যাশ একটি স্ট্রিং হয় তবে আমাকে এটি একটি হট-এনকোড করতে হবে, যার ফলে প্রচুর পরিমাণে ভেরিয়েবল পাওয়া যাবে ঠিক যেমন হট-এনকোডেড জিপকোডের মতো।
stackoverflowuser2010

জিওহ্যাশ হ'ল একক সংখ্যা, বেস 32 এ এনকোডেড 1 1-হট এনকোডের কোনও কারণ নেই। নির্ভুলতার স্তরটি বেছে নিন এবং সংখ্যার প্রাসঙ্গিক সংখ্যাটি ব্যবহার করুন।
ব্রায়ান স্পিয়ারিং

আমি কেবল জিওহাসের স্ট্রিং উপস্থাপনা দেখেছি। যাইহোক, জিওহেসগুলি দীর্ঘ ইনট হিসাবে প্রতিনিধিত্ব করা হলেও, লিনিয়ার মডেলটিতে ব্যবহারের জন্য কি তাদের মধ্যে কোনও রৈখিক সম্পর্ক রয়েছে? এটাই আমার মূল প্রশ্নের মূল বিষয়।
stackoverflowuser2010

Geohashes মধ্যে সম্পর্ক কিছুটা জটিল - en.wikipedia.org/wiki/Geohash#Design
ব্রায়ান Spiering

1
লিনিয়ার এবং ওয়ান-হট এনকোডিংয়ের বাইরে বৈশিষ্ট্য ইঞ্জিনিয়ারিংয়ের অনেকগুলি উপায় রয়েছে। উদাহরণস্বরূপ, কার্নেল ট্রিক বা হেলমার্ট রূপান্তর।
ব্রায়ান স্পিয়ারিং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.