আমার একটি ফাইল জিওডাটাবেজে (000 4 000 000 রেকর্ডস) একটি দুর্দান্ত বিগ পয়েন্ট ফিচার ক্লাস রয়েছে। এটি 100 মিটার রেজোলিউশন সহ পয়েন্টগুলির নিয়মিত গ্রিড।
এই স্তরটিতে আমার এক ধরণের সাধারণীকরণ করা দরকার perform এর জন্য, আমি একটি নতুন গ্রিড তৈরি করি যেখানে প্রতিটি পয়েন্ট 4 "পুরানো" পয়েন্টের মাঝখানে থাকে:
* * * *
o o o
* * * *
o o o
* * * *
[*] = মূল গ্রিডের পয়েন্ট - [ও] = নতুন গ্রিডের পয়েন্ট
প্রতিটি নতুন পয়েন্টের বৈশিষ্ট্যের মানটি পুরানো গ্রিডে তার 4 প্রতিবেশীর ভারিত মানের ভিত্তিতে গণনা করা হয়। আমি এইভাবে আমার নতুন গ্রিডের সমস্ত পয়েন্টগুলিতে লুপ করি এবং তাদের প্রত্যেকের জন্য প্রতিবেশীদের সন্ধান করতে (বৈশিষ্ট্য সারণীতে এক্স এবং ওয়াইয়ের মান তুলনা করে) আমি আমার পুরানো গ্রিডের সমস্ত পয়েন্টগুলিতে লুপ করি। একবার 4 প্রতিবেশী পাওয়া গেছে, আমরা লুপ থেকে বেরিয়ে যান।
এখানে কোনও পদ্ধতিগত জটিলতা নেই তবে আমার সমস্যাটি হ'ল আমার প্রথম পরীক্ষার উপর ভিত্তি করে এই স্ক্রিপ্টটি কয়েক সপ্তাহ পর্যন্ত শেষ হবে ...
আপনি এটিকে আরও দক্ষ করার কোনও সম্ভাবনা দেখছেন? আমার মাথার শীর্ষে কয়েকটি ধারণা:
- ক্ষেত্রগুলি X এবং Y => সূচকগুলি আমি তা করেছিলাম তবে কোনও উল্লেখযোগ্য পারফরম্যান্সের পরিবর্তন লক্ষ্য করিনি
- কোনও অ্যাট্রিবিউট-ভিত্তিক না হয়ে প্রতিবেশীদের সন্ধানের জন্য একটি স্থানিক জিজ্ঞাসা করুন। এটা কি আসলে সাহায্য করবে? আরকজিআইএস-এ কোন স্থানিক কাজটি করা উচিত? আমি সন্দেহ করি যে, উদাহরণস্বরূপ, প্রতিটি নতুন পয়েন্ট বাফারিং আরও কার্যকর প্রমাণিত করবে
- বৈশিষ্ট্য শ্রেণিকে একটি নুমপি অ্যারে রূপান্তর করুন। যে সাহায্য করবে? আমি এখন পর্যন্ত নুমপির সাথে খুব বেশি কাজ করি নি এবং কেউ যদি আমাকে না বলে এটি প্রসেসিংয়ের সময় হ্রাস করতে সহায়তা করে তবে আমি তাতে ডুব দিতে চাই না
- আর কিছু?