টেবিল দেওয়া:
Column | Type
id | integer
latitude | numeric(9,6)
longitude | numeric(9,6)
speed | integer
equipment_id | integer
created_at | timestamp without time zone
Indexes:
"geoposition_records_pkey" PRIMARY KEY, btree (id)
টেবিলে 20 মিলিয়ন রেকর্ড রয়েছে যা তুলনামূলকভাবে বলার অপেক্ষা রাখে না। তবে এটি ক্রমিক স্ক্যানগুলি ধীর করে দেয়।
আমি কীভাবে max(created_at)
প্রত্যেকের শেষ রেকর্ড ( ) পেতে পারি equipment_id
?
আমি এই বিষয়টির অনেক উত্তরের মাধ্যমে বেশ কয়েকটি বৈকল্পিক সহ নিম্নলিখিত দুটি প্রশ্নের চেষ্টা করেছি:
select max(created_at),equipment_id from geoposition_records group by equipment_id;
select distinct on (equipment_id) equipment_id,created_at
from geoposition_records order by equipment_id, created_at desc;
আমি এর জন্য বিটি্রি সূচী তৈরি করার চেষ্টাও করেছি equipment_id,created_at
কিন্তু পোস্টগ্রিস দেখতে পেয়েছে যে সিক্সস্ক্যান ব্যবহার করা আরও দ্রুত। enable_seqscan = off
সেক স্ক্যানের মতো সূচকটি পড়ার চেয়ে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে পড়তে বাধ্য করাও কার্যকর নয়।
ক্যোয়ারীটি সর্বদা সর্বশেষে ফিরে আসার জন্য পর্যায়ক্রমে চলতে হবে।
পোস্টগ্রিস 9.3।
ব্যাখ্যা করুন / বিশ্লেষণ করুন (1.7 মিলিয়ন রেকর্ড সহ):
set enable_seqscan=true;
explain analyze select max(created_at),equipment_id from geoposition_records group by equipment_id;
"HashAggregate (cost=47803.77..47804.34 rows=57 width=12) (actual time=1935.536..1935.556 rows=58 loops=1)"
" -> Seq Scan on geoposition_records (cost=0.00..39544.51 rows=1651851 width=12) (actual time=0.029..494.296 rows=1651851 loops=1)"
"Total runtime: 1935.632 ms"
set enable_seqscan=false;
explain analyze select max(created_at),equipment_id from geoposition_records group by equipment_id;
"GroupAggregate (cost=0.00..2995933.57 rows=57 width=12) (actual time=222.034..11305.073 rows=58 loops=1)"
" -> Index Scan using geoposition_records_equipment_id_created_at_idx on geoposition_records (cost=0.00..2987673.75 rows=1651851 width=12) (actual time=0.062..10248.703 rows=1651851 loops=1)"
"Total runtime: 11305.161 ms"
NULL
মান ছিল নাequipment_id
0.1% এর নিচে