পাইথন কাঠামোর ইন-মেমরি আকার


118

32- এবং 64-বিট প্ল্যাটফর্মগুলিতে পাইথন ডেটা স্টাকচারের মেমরি আকারের জন্য কোনও রেফারেন্স রয়েছে?

যদি তা না হয় তবে এটি এটির সাথে রাখা ভাল। আরও পরিশ্রমী আরও ভাল! তাহলে নীচের পাইথন স্ট্রাকচারগুলি ( lenপ্রাসঙ্গিকভাবে এবং সামগ্রীর ধরণের উপর নির্ভর করে ) কতগুলি বাইট ব্যবহার করেন ?

  • int
  • float
  • উল্লেখ
  • str
  • ইউনিকোড স্ট্রিং
  • tuple
  • list
  • dict
  • set
  • array.array
  • numpy.array
  • deque
  • নতুন ধাঁচের ক্লাস অবজেক্ট
  • পুরানো শৈলী ক্লাস অবজেক্ট
  • ... এবং আমি সবকিছু ভুলে যাচ্ছি!

(যে পাত্রে কেবলমাত্র অন্য অবজেক্টের রেফারেন্স থাকে, আমরা অবশ্যই আইটেমের আকারটি নিজেরাই গণনা করতে চাই না, কারণ এটি ভাগ করা হতে পারে))

তদুপরি, রানটাইম (পুনরাবৃত্তভাবে বা না) কোনও বস্তুর দ্বারা ব্যবহৃত স্মৃতি পাওয়ার কী উপায় আছে?


এখানে প্রচুর সহায়ক ব্যাখ্যা পাওয়া যেতে পারে এখানে স্ট্যাকওভারফ্লো / প্রশ্নগুলি5959674/python- মেমরি- মডেল । আমি আরও একটি নিয়মিত ওভারভিউ দেখতে চাই, যদিও
লেইমিজ

3
একটি NumPy অ্যারে জন্য a, ব্যবহার করুন a.nbytes
উইল

: যদি আপনি এই একটি গ্রাফিক্যাল দৃশ্য আগ্রহী, আমি তা একটি চক্রান্ত একবার তৈরি stackoverflow.com/a/30008338/2087463
tmthydvnprt

উত্তর:


145

সম্পর্কে পূর্ববর্তী প্রশ্নের পরামর্শটি ছিল sys.getsizeof () ব্যবহার করে , উদ্ধৃত করে:

>>> import sys
>>> x = 2
>>> sys.getsizeof(x)
14
>>> sys.getsizeof(sys.getsizeof)
32
>>> sys.getsizeof('this')
38
>>> sys.getsizeof('this also')
48

আপনি এই পদ্ধতির গ্রহণ করতে পারেন:

>>> import sys
>>> import decimal
>>> 
>>> d = {
...     "int": 0,
...     "float": 0.0,
...     "dict": dict(),
...     "set": set(),
...     "tuple": tuple(),
...     "list": list(),
...     "str": "a",
...     "unicode": u"a",
...     "decimal": decimal.Decimal(0),
...     "object": object(),
... }
>>> for k, v in sorted(d.iteritems()):
...     print k, sys.getsizeof(v)
...
decimal 40
dict 140
float 16
int 12
list 36
object 8
set 116
str 25
tuple 28
unicode 28

2012-09-30

পাইথন 2.7 (লিনাক্স, 32-বিট):

decimal 36
dict 136
float 16
int 12
list 32
object 8
set 112
str 22
tuple 24
unicode 32

অজগর 3.3 (লিনাক্স, 32-বিট)

decimal 52
dict 144
float 16
int 14
list 32
object 8
set 112
str 26
tuple 24
unicode 26

2016-08-01

ওএসএক্স, পাইথন ২.7.১০ (ডিফল্ট, অক্টোবর 23 2015, 19:19:21) [জিসিসি 4.2.1 সামঞ্জস্যপূর্ণ অ্যাপল এলএলভিএম 7.0.0 (ঝনঝন-700.0.59.5)] ডারউইনে

decimal 80
dict 280
float 24
int 24
list 72
object 16
set 232
str 38
tuple 56
unicode 52

1
ধন্যবাদ, এবং দ্বিতীয় প্রশ্নের জন্য ডুপের জন্য দুঃখিত ... খুব খারাপ আমি 2.5 ব্যবহার করছি এবং 2.6 নয় ...
লেমিজ

আমি ভুলে গিয়েছিলাম যে সাম্প্রতিক উবুন্টু সহ আমার একটি ভার্চুয়াল বাক্স ছিল! এটি আশ্চর্যের বিষয়, sys.getsizeof (ডিক) আমার জন্য 136 (অজগর ২.6 একটি কুবুন্টু ভিএম চালাচ্ছেন, ওএস এক্স দ্বারা হোস্ট করা হয়েছে, সুতরাং আমি কোনও কিছুর বিষয়ে নিশ্চিত নই)
লেইমিজ

@ লিমিজ: আমার জন্য (পাইথন ২.6, উইন্ডোজ এক্সপি এসপি 3), sys.getsizeof (ডিক্ট) -> 436; sys.getsizeof (ডিক ()) -> 140
জন মাচিন

লেমিজ-কুবুন্টু: পাইথন 2.6 পাইথন 2.6.2 (রিলিজ 26-রক্ষণাবেক্ষণ, এপ্রিল 19 2009, 01:56:41) [জিসিসি 4.3.3] লিনাক্স 2 এ "সহায়তা", "কপিরাইট", "ক্রেডিট" বা "লাইসেন্স" টাইপ করুন আরও তথ্যের জন্য. >>> sys আমদানি করুন >>> sys.getsizeof (ডিক) 436 >>> sys.getsizeof (ডিক ()) 136
লেমিজ

1
না মান হওয়া উচিত 0, 0.0, ''এবং u''দৃঢ়তা জন্য?
সাইলেন্টগোস্ট

37

আমি আনন্দের সাথে এই জাতীয় কাজের জন্য পিম্পলার ব্যবহার করছি । এটি পাইথনের বহু সংস্করণের সাথে সামঞ্জস্যপূর্ণ - asizeofবিশেষত মডিউলটি ২.২-এ ফিরে যায়!

উদাহরণস্বরূপ, হিউডব্রাউন উদাহরণ ব্যবহার from pympler import asizeofকরে তবে শুরুতে এবং print asizeof.asizeof(v)শেষের সাথে আমি দেখতে পাচ্ছি (ম্যাকোএসএক্স 10.5 তে পাইথন সিস্টেম 2.5):

$ python pymp.py 
set 120
unicode 32
tuple 32
int 16
decimal 152
float 16
list 40
object 0
dict 144
str 32

স্পষ্টতই এখানে কিছুটা আনুষঙ্গিকতা রয়েছে তবে আমি এটি পাদচালিত বিশ্লেষণ এবং সুরের জন্য খুব দরকারী বলে মনে করেছি।


1
কিছু কৌতূহল: আপনার বেশিরভাগ সংখ্যা 4 টি বেশি; অবজেক্ট 0; এবং দশমিকটি আপনার অনুমান অনুসারে প্রায় 4 গুণ বড় is
হুগডব্রাউন

1
হাঁ। "4 উচ্চতর" আসলে বেশিরভাগ দেখতে "8 এর একাধিক পর্যন্ত বৃত্তাকার" বলে মনে হয় যা আমি বিশ্বাস করি যে এখানে ম্যালোক যেভাবে আচরণ করে তার জন্য এটি সঠিক। দশমিক কেন এত বিকৃত হয়ে যায় তা ধারণা নেই (২.6-তেও পিম্পলার দিয়ে)।
অ্যালেক্স মার্টেলি

2
আসলে, আপনার sys.getsizeof () এর অনুরূপ কার্যকারিতা পেতে pympler.asizeof.flatsize () ব্যবহার করা উচিত। আপনি ব্যবহার করতে পারেন এমন একটি অ্যালাইন = প্যারামিটারও রয়েছে (যা অ্যালেক্সের নির্দেশ অনুসারে ডিফল্টরূপে 8 হয়)।
পঙ্করত

@ অ্যালেক্সমার্টেলি হাই অ্যালেক্স! .. পাইথনে চরের ন্যূনতম আকার 25 বাইট কেন। >>> getsizeof('a')দেয় 25এবং >>> getsizeof('ab')দেয় 26`
গ্রিজেশ চৌহান

1
আমি মনে করি আকারটি বাইটে রয়েছে, তবে কেন এটি কোথাও লিখিত হয়নি, এমনকি পাইথনহস্টেড.অর্গ
পাইপলার

35

এই উত্তরগুলি সমস্ত অগভীর আকারের তথ্য সংগ্রহ করে। আমি সন্দেহ করি যে এই প্রশ্নের দর্শনার্থীরা এই প্রশ্নের উত্তর খুঁজতে এখানেই শেষ হবে, "স্মৃতিতে এই জটিল বস্তুটি কত বড়?"

এখানে দুর্দান্ত উত্তর রয়েছে: https://goshippo.com/blog/measure-real-size-any-python-object/

পাঞ্চলাইন:

import sys

def get_size(obj, seen=None):
    """Recursively finds size of objects"""
    size = sys.getsizeof(obj)
    if seen is None:
        seen = set()
    obj_id = id(obj)
    if obj_id in seen:
        return 0
    # Important mark as seen *before* entering recursion to gracefully handle
    # self-referential objects
    seen.add(obj_id)
    if isinstance(obj, dict):
        size += sum([get_size(v, seen) for v in obj.values()])
        size += sum([get_size(k, seen) for k in obj.keys()])
    elif hasattr(obj, '__dict__'):
        size += get_size(obj.__dict__, seen)
    elif hasattr(obj, '__iter__') and not isinstance(obj, (str, bytes, bytearray)):
        size += sum([get_size(i, seen) for i in obj])
    return size

এর মতো ব্যবহৃত:

In [1]: get_size(1)
Out[1]: 24

In [2]: get_size([1])
Out[2]: 104

In [3]: get_size([[1]])
Out[3]: 184

আপনি যদি পাইথনের মেমরির মডেলটি আরও গভীরভাবে জানতে চান তবে এখানে একটি দুর্দান্ত নিবন্ধ রয়েছে যা দীর্ঘ ব্যাখ্যার অংশ হিসাবে কোডের অনুরূপ একটি "মোট আকার" স্নিপেট রয়েছে: https://code.tutsplus.com/tutorials/:30:30-how- অনেক-মেমরি আপনার-পাইথন-বস্তু-ব্যবহার - CMS-25609


সুতরাং এটি দ্বারা ব্যবহৃত মোট পরিমাণের মেমরি পাওয়া উচিত, উদাহরণস্বরূপ, একাধিক অ্যারে এবং / অথবা অন্যান্য ডিকস যুক্ত একটি ডিক?
চার্লি এম্পেরুর-মোট

1
@ চার্লিএম্পিয়ার-মোট ইয়েপ
কোবল্ড

দুর্দান্ত উত্তর। এটি সংকলিত সিথন অবজেক্টের জন্য কাজ করছে বলে মনে হয় না। আমার ক্ষেত্রে এই পদ্ধতিটি 96ইন-মেমোরি সিথন অবজেক্টের পয়েন্টারের জন্য ফেরত দেয়
ফের্ডিনেটর

8

মেমরি প্রোফাইলার চেষ্টা করুন। মেমরি প্রোফাইলার

Line #    Mem usage  Increment   Line Contents
==============================================
     3                           @profile
     4      5.97 MB    0.00 MB   def my_func():
     5     13.61 MB    7.64 MB       a = [1] * (10 ** 6)
     6    166.20 MB  152.59 MB       b = [2] * (2 * 10 ** 7)
     7     13.61 MB -152.59 MB       del b
     8     13.61 MB    0.00 MB       return a

1
যথার্থতা 1 / 100MB, বা 10.24 বাইট বলে মনে হচ্ছে। এটি ম্যাক্রো-বিশ্লেষণের জন্য সূক্ষ্ম, তবে আমি সন্দেহ করি যে এই জাতীয় নির্ভুলতা প্রশ্নে জিজ্ঞাসা করা ডেটা স্ট্রাকচারগুলির একটি সঠিক তুলনা করতে পারে।
জোড়ান পাভলভিক

7

এছাড়াও আপনি গুপি মডিউল ব্যবহার করতে পারেন ।

>>> from guppy import hpy; hp=hpy()
>>> hp.heap()
Partition of a set of 25853 objects. Total size = 3320992 bytes.
 Index  Count   %     Size   % Cumulative  % Kind (class / dict of class)
     0  11731  45   929072  28    929072  28 str
     1   5832  23   469760  14   1398832  42 tuple
     2    324   1   277728   8   1676560  50 dict (no owner)
     3     70   0   216976   7   1893536  57 dict of module
     4    199   1   210856   6   2104392  63 dict of type
     5   1627   6   208256   6   2312648  70 types.CodeType
     6   1592   6   191040   6   2503688  75 function
     7    199   1   177008   5   2680696  81 type
     8    124   0   135328   4   2816024  85 dict of class
     9   1045   4    83600   3   2899624  87 __builtin__.wrapper_descriptor
<90 more rows. Type e.g. '_.more' to view.>

এবং:

>>> hp.iso(1, [1], "1", (1,), {1:1}, None)
Partition of a set of 6 objects. Total size = 560 bytes.
 Index  Count   %     Size   % Cumulative  % Kind (class / dict of class)
     0      1  17      280  50       280  50 dict (no owner)
     1      1  17      136  24       416  74 list
     2      1  17       64  11       480  86 tuple
     3      1  17       40   7       520  93 str
     4      1  17       24   4       544  97 int
     5      1  17       16   3       560 100 types.NoneType

0

tracemallocপাইথন স্ট্যান্ডার্ড লাইব্রেরি থেকে কেউ মডিউলটি ব্যবহার করতে পারে । এটি এমন বস্তুর জন্য ভাল কাজ করছে বলে মনে হচ্ছে যার ক্লাস সিতে প্রয়োগ করা হয়েছে (উদাহরণস্বরূপ, পাইপলারের বিপরীতে)।


-1

আপনি dir([object])অন্তর্নির্মিত ফাংশনটি ব্যবহার করার সময় বিল্ট-ইন ফাংশনটি পেতে পারেন __sizeof__

>>> a = -1
>>> a.__sizeof__()
24
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.