একটি ছবিতে "ফ্রিকোয়েন্সি" এর অর্থ কী?


30

আমি বুঝতে পারি না কীভাবে চিত্র / ফটোগ্রাফগুলিতে ফ্রিকোয়েন্সি সংজ্ঞায়িত করা হয়। যতদূর আমি এখন এটি বুঝতে পারি, উচ্চ ফ্রিকোয়েন্সিগুলি চিত্রের ধারালো জিনিসগুলির মতো, প্রান্তের মতো বা কম, এবং কম ফ্রিকোয়েন্সিগুলি বিপরীত ধরণের?

আমি কীভাবে সেগুলি যথাযথভাবে পড়তে পারি তার মতো ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্মেশনগুলির ফলাফলটিও বুঝতে চাই।

যদি কেউ আমাকে নিম্নলিখিতটি ব্যাখ্যা করতে পারে তবে শীতল হবে:

  1. ছবিগুলিতে ফ্রিকোয়েন্সিগুলি কী কী এবং সেগুলি কীভাবে সংজ্ঞায়িত করা হয়?

  2. আপনি কীভাবে একটি আলাদা ফুরিয়ার রূপান্তর ফলাফল পড়বেন?



ধন্যবাদ, আমি ইতিমধ্যে এটি পড়েছি, এটি আমাকে সাহায্য করেছিল, তবে আমি এখনও কিছুটা নিখরচায়।
Jakob Abfalter

উত্তর:


44

আমি কেবল প্রথম প্রশ্নের উত্তর দেব: চিত্রগুলিতে ফ্রিকোয়েন্সিগুলি কী কী?

ফুরিয়ার ট্রান্সফর্ম একটি গাণিতিক কৌশল যেখানে একই চিত্রের তথ্য প্রতিটি পিক্সেলের জন্য পৃথকভাবে নয় বরং প্রতিটি ফ্রিকোয়েন্সিটির জন্য প্রতিনিধিত্ব করা হয়। এই ভাবে চিন্তা করুন। সমুদ্রের তরঙ্গ রয়েছে যার কয়েকটি খুব ধীরে ধীরে চলমান (জোয়ারের মতো), অন্যরা মাঝারি আকারের এবং এখনও কিছু অন্যরা এক ঝাঁকুনি থেকে তৈরি ppেউয়ের মতো ছোট। আপনি এগুলিকে তিনটি পৃথক তরঙ্গ হিসাবে ভাবতে পারেন তবে সমুদ্রের পৃষ্ঠের প্রতিটি বিন্দুতে এবং এক মুহুর্তে, আপনি পানির এক উচ্চতা পান।

একই চিত্রগুলির ক্ষেত্রে প্রযোজ্য। আপনি ভাবতে পারেন যে চিত্রটি বিভিন্ন তরঙ্গ বা ফ্রিকোয়েন্সি নিয়ে গঠিত। আপনার চিত্র তৈরি করতে, গড় রঙ দিয়ে শুরু করুন (ধূসর স্কেল চিত্রগুলির ভাবনা আরও সহজ)। তারপরে ছবিটিতে বিশদটি ধীরে ধীরে তৈরি করতে বিভিন্ন তরঙ্গ দৈর্ঘ্যের এবং শক্তির তরঙ্গ যুক্ত করুন।

উত্স চিত্র:

উত্স চিত্র

প্রথম ফ্রিকোয়েন্সি (গড়):

গড়

উল্লম্ব মাত্রা বরাবর দ্বিতীয় ফ্রিকোয়েন্সি চিত্রের নীচে শূন্য থেকে শুরু করে একটি তরঙ্গ, উত্থিত, কেন্দ্রিক দিগন্ত বরাবর আবার শূন্য হয়ে এবং শূন্যের নীচে পড়ে চিত্রের শীর্ষে শূন্যে পরিণত হয়। (আমি ফেজ শিফট ছাড়াই একটি ফুরিয়ার সিরিজ বর্ণনা করেছি, তবে সাদৃশ্যটি এখনও ধারণ করে))

অনুভূমিক এবং উল্লম্ব বরাবর আপনি এখানে দ্বিতীয় ফ্রিকোয়েন্সি দেখতে পাবেন। লক্ষ্য করুন যে আপনি কোথায় পর্বতটি হবে (অন্ধকার) এবং যেখানে আকাশ এবং হ্রদ হবে (হালকা) can

দ্বিতীয় ফ্রিকোয়েন্সি:

প্রথম উপাদান

প্রতিটি অতিরিক্ত তরঙ্গ বা ফ্রিকোয়েন্সি আরও বেশি রিপ্লে এবং আরও কিছু বিস্তারিত নিয়ে আসে। বিভিন্ন চিত্র পেতে, তরঙ্গের উচ্চতা / প্রশস্ততা পরিবর্তিত হতে পারে তরঙ্গের প্রারম্ভিক বিন্দু, যাকে ফেজও বলা হয়।

তৃতীয় ফ্রিকোয়েন্সি:

তৃতীয়

মজার বিষয় হল, তথ্য উপাত্তটি এই উপস্থাপনে একই এবং সাধারণ চিত্র (স্থানিক ডোমেন) এবং ফুরিয়ার ট্রান্সফর্মড ইমেজ (ফ্রিকোয়েন্সি ডোমেন) এর মধ্যে একটির পিছনে যেতে পারে। ফ্রিকোয়েন্সি ডোমেনে আমাদের প্রশস্ততা এবং পর্বের তথ্যের সাথে সমস্ত ফ্রিকোয়েন্সিগুলির তথ্য রাখতে হবে।

এখানে এটি 50% ফ্রিকোয়েন্সি ব্যবহার করছে:

50%

ফুরিয়ার সিরিজ, ফুরিয়ার ট্রান্সফর্ম এবং ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্ম এবং ডিস্রিট কোসিন ট্রান্সফর্ম (ডিসিটি) এর মধ্যে আলাদা করার জন্য এই সমস্তগুলির বিভিন্ন রূপ রয়েছে।

একটি আকর্ষণীয় অ্যাপ্লিকেশন হ'ল জেপিইগির মতো সংকোচনের আলগোরিদিমগুলির ব্যবহার। এখানে ডিসিটি ব্যবহার করা হয় চিত্রের আরও গুরুত্বপূর্ণ অংশগুলি (কম ফ্রিকোয়েন্সি) এবং উচ্চ ফ্রিকোয়েন্সিগুলির কম save

আমি এই আশায় লিখেছিলাম যে, নবীন পাঠকরা ফুরিয়ার ট্রান্সফর্মসের ধারণার প্রাথমিক ধারণা পেতে পারেন। তার জন্য আমি কিছু সরলকরণ করেছি যা আমি আশা করি আরও উন্নত পাঠকরা আমাকে ক্ষমা করবেন।

অ্যানিমেটেড

টমাস Devoogdt দ্বারা উত্পন্ন ভিডিওতে দেখা যাবে Vimeo

অ্যানিমেটেড


পোস্ট-প্রসেসিংয়ে ফ্রিকোয়েন্সি

এমন অনেক পদ্ধতি রয়েছে যা পোস্ট প্রসেসিংয়ের জন্য ফ্রিকোয়েন্সিগুলির উপর নির্ভর করে, বেশিরভাগ কারণে যে আমরা একক পিক্সেল এককভাবে দেখি না। অনেক অ্যালগরিদম ফ্রিকোয়েন্সি নিয়ে কাজ করে কারণ এগুলি সম্পর্কে এ জাতীয়ভাবে চিন্তা করা বেশি স্বাভাবিক। তবে ফুুরিয়ার ট্রান্সফর্মটিতে একই তথ্য রয়েছে বলে আমরা ফ্রিকোয়েন্সি এবং স্পেসিয়াল ডোমেনগুলিতে কোনও গাণিতিক ক্রিয়াকলাপ (বা পোস্ট প্রসেসিং পদক্ষেপ) প্রকাশ করতে পারি! কখনও কখনও পিক্সেল-ভিত্তিক বিবরণ ভাল তবে প্রায়শই ফ্রিকোয়েন্সি বিবরণ আরও ভাল। (আরও ভাল প্রাথমিকভাবে এই প্রসঙ্গে দ্রুত বোঝানো হয়।)

একটি কৌশল যা আমি নির্দিষ্ট কারণে বিন্দুমাত্র উল্লেখ করতে চাই তা ব্যতীত এটি শিল্পীরা হলেন সরাসরি ফ্রিকোয়েন্সি নিয়ে কাজ করে এবং এটি হ'ল ফ্রিকোয়েন্সি বিচ্ছেদ *। আমি এটি বর্ণনা করতে যাচ্ছি না তবে আপনি দেখতে পারবেন এটি কীভাবে ইউটিউবে ফটোশপ এবং জিআইএমপি উভয়ের জন্য কাজ করে।

আপনি দু'টি স্তর তৈরি করেন একটি কম ফ্রিকোয়েন্সি সহ এবং একটি উচ্চ ফ্রিকোয়েন্সি সহ। প্রতিকৃতিগুলির জন্য আপনি কম ফ্রিকোয়েন্সিগুলিতে ত্বকের সুরকে প্রভাবিত না করে উচ্চ ফ্রিকোয়েন্সিগুলিতে ত্বককে মসৃণ করতে পারেন।

কোড

উপরের উদাহরণগুলি উত্পন্ন করার জন্য এটি কিছু কোড। এটি একটি সাধারণ পাইথন প্রোগ্রাম হিসাবে চালানো যেতে পারে।

from PIL import Image
from numpy.fft import rfft2, irfft2
import numpy as np

def save_dims(ft, low, high, name):
    ft2 = np.zeros_like(ft)
    # copy the frequencies from low to high but all others stay zero.
    ft2[low:high, low:high] = ft[low:high, low:high]
    save(ft2, name)

def save(ft, name):
    rft = irfft2(ft)
    img = Image.fromarray(rft)
    img = img.convert('L')
    img.save(name)

def main():
    # Convert input into grayscale and save.
    img = Image.open("input.jpg")
    img = img.convert('L')
    img.save('input_gray.png')
    # Do Fourier Transform on image.
    ft = rfft2(img)
    # Take only zeroth frequency and do Inverse FT and save.
    save_dims(ft, 0, 1, 'output_0.png')
    # Take first two frequencies in both directions.
    save_dims(ft, 0, 2, 'output_1.png')
    save_dims(ft, 0, 3, 'output_2.png')
    # Take first 50% of frequencies.
    x = min(ft.shape)
    save_dims(ft, 0, x/2, 'output_50p.png')

def generateGif():
    ''' Generates images to be later converted to a gif.
    This requires ImageMagick:
    convert -delay 100 -loop 0 output_*.png animation.gif
    '''
    # Requires images2gif from code.google.com/p/visvis/source/browse/vvmovie/images2gif.py 
    # from images2gif import writeGif

    img = Image.open('input.jpg')
    img = img.convert('L')
    # Resize image before any calculation.
    size = (640,480)
    img.thumbnail(size, Image.ANTIALIAS)
    ft = rfft2(img)

    images = []
    for x in range(0, max(ft.shape)):
        ft2 = np.zeros_like(ft)
        ft2[0:x, 0:x] = ft[0:x,0:x]
        rft = irfft2(ft2)
        img_out = Image.fromarray(rft).convert('L')
        fname = 'animation/output_%05d.jpg' %(x, )
        img_out.save(fname, quality=60, optimize=True)

    #writeGif('animation.gif', images, duration=0.2)


if __name__=='__main__':
    main()
    #generateGif()

এটি স্পষ্ট করে বলা উচিত যে তাত্ত্বিকভাবে আমরা ধরে নিতে পেরেছিলাম যে আমরা হাতে থাকা ইমেজটির অসীম জ্ঞান পেয়েছি, এটি উপাদান উপাদানগুলিতে ক্ষয় করেছিলাম এবং কোনও ক্ষতি ছাড়াই এটি পুনরুদ্ধার করতে পারি ... আসল বিশ্বে আমরা পারি না। একটি বাস্তব বিশ্বের চিত্রের রূপান্তর, যা অপটিকাল পাইপলাইন বরাবর প্রতিটি "ইন্টারফেস" এ ঘটে, কার্যকরভাবে একটি অপরিবর্তনীয় প্রক্রিয়া। আমরা কখনই সমস্ত সংশ্লেষের কারণগুলি জানতে পারি না এবং এর জন্য কোনও এফএফটি একটি চিত্রের মধ্যে পুনর্নির্মাণ করা কঠিন এবং চূড়ান্ত পরিবর্তনগুলি সাধারণত নিদর্শনগুলি এবং ডেটা হ্রাস পায়।
জ্রিস্টা

@ জ্রিস্টা আমি মনে করি আনপিয়েডেরা যে বিপরীতে পুনরায় পরিবর্তনযোগ্যতাটি নিয়েছিল তা হ'ল একবার আপনি ডিজিটাল চিত্র (কম্পিউটারে পিক্সেলের একটি অ্যারে) নিয়ে কাজ করার পরে আপনি ফ্রিকোয়েন্সি স্পেস এবং পিছনে যেতে পারেন এবং একই চিত্রটি আপনি শুরু করতে পারেন। আপনি শারীরিক ইমেজিং সিস্টেমের একটি বৃহত্তর ছবি (লেন্স এবং এ জাতীয়) সন্ধান করছেন, যেখানে বাস্তব-বিশ্বের সীমাবদ্ধতা প্রবেশ করে।
কনস্লেয়ার

3
জাস্টার মন্তব্য বিভ্রান্তিকর যে এফটি তথ্য ক্ষতির জন্য দায়ী করা হয়েছে। অবশ্যই, ফটোগ্রাফি একটি ক্ষতির প্রক্রিয়া এবং পোস্ট-প্রসেসিংও। যদি আমি একটি পৃথক চিত্রটিকে ফুরিয়ার স্পেসে রূপান্তর করি তবে সেখানে কিছু ক্ষতিকারক প্রক্রিয়াজাতকরণ করুন এবং তারপরে ফিরে রূপান্তর করুন অবশ্যই আমি তথ্য আলগা করি। এটি রূপান্তর পদক্ষেপে নয় বরং প্রক্রিয়াজাতকরণের ধাপে ঘটে। সত্য, মেশিনের নির্ভুলতার কারণে প্রতিটি গাণিতিক ক্রিয়াকলাপ তথ্য হারিয়ে ফেলে তবে আমরা যদি প্রতি চ্যানেল চিত্রের জন্য 8 বিটের কথা বলি, আমরা মেশিনের যথার্থ ত্রুটিগুলি লক্ষ্য করব না।
আনপিডের

1
@ তুরকিফান্ত, আমি কেন সেই প্রসঙ্গে তির্যক উল্লেখ করি তা মনে নেই। আপনি দেখতে পাচ্ছেন যে দ্বিতীয় ফ্রিকোয়েন্সিটির মূল দিকটি নির্দিষ্ট তির্যক বলে মনে হয়। হতে পারে তাই। আপনার প্রশ্নের উত্তর দিতে আপনার 2D চিত্রের প্রতিনিধিত্ব করার জন্য কেবল দুটি অক্ষ প্রয়োজন। দুটি অক্ষটি অরথোগোনাল এটি গুরুত্বপূর্ণ। অনুভূমিক এবং উল্লম্ব অক্ষগুলি এই মানদণ্ডটি পূরণ করে। (এছাড়াও তারা ব্যবহারিক।
আনপিডের

1
@ তুরকিফান্ত সংশোধন, ইউনাপিয়েড্রা দ্বিতীয় ফ্রিকোয়েন্সিটি প্রথম হিসাবে নয়, 0, -1, 0, + 1, 0 হিসাবে বর্ণনা করেছেন। ২ য় ফ্রিকোয়েন্সি বর্ণনাকারী অনুচ্ছেদগুলি 1 ম ফ্রিকোয়েন্সি চিত্রের পরে (অভিন্ন ধূসর চিত্র) এর পরে রয়েছে এবং আমি পূর্ববর্তী চিত্রের বিবরণ হিসাবে সেই অনুচ্ছেদটি পড়তে কীভাবে প্রলুব্ধ হতে পারে তা দেখুন (নিবন্ধগুলি প্রায়শই একটি চিত্র দেখায়, তারপরে চিত্রটি অনুসরণ করে পাঠ্যে বর্ণনা করুন), তবে এই ক্ষেত্রে নয়। =)
স্কটবিবি

9

আমি সহজতম গণিতের পদগুলি দিয়ে ব্যাখ্যা করার চেষ্টা করব। আপনি যদি গণিতটি এড়িয়ে যেতে চান তবে দ্বিতীয় খণ্ডে ঝাঁপুন, যদি আপনি সংক্ষিপ্ত উত্তরটি তৃতীয় খণ্ডে যেতে চান

প্রথম খণ্ড

সিগন্যালের ফ্রিকোয়েন্সি মানে প্রতি ইউনিট পুনরাবৃত্তি ইভেন্টের সংখ্যার সংখ্যা। সুতরাং সময়ের এককটি যদি সেকেন্ড হয় তবে ফ্রিকোয়েন্সি হার্জ: 1Hz = 1 / s দিয়ে পরিমাপ করা হয়। সুতরাং 100Hz সহ একটি সংকেতটিতে এমন একটি প্যাটার্ন রয়েছে যা প্রতি সেকেন্ডে 100 বার পুনরাবৃত্তি করে।

সর্বাধিক প্রাথমিক সংকেত (সিগন্যাল প্রক্রিয়াকরণের দৃষ্টিকোণ থেকে) একটি সাইনাস সংকেত।

y (t) = sin (2πft)

যেখানে f এই সাইনাস সংকেতের ফ্রিকোয়েন্সি এবং টি সময়। যদি এই সিগন্যালটি সুরত হয় এবং f 50Hz এর কাছাকাছি হয় তবে আপনি খুব নীচে বাসের একটি শব্দ শুনতে পাবেন। 15kHz এর মতো উচ্চতর ফ্রিকোয়েন্সি সহ এটি উচ্চতর স্বর হবে।

এখন ধারণাকে সাধারণীকরণের জন্য, সংকেতটি সাময়িক সংকেতের পরিবর্তে একটি স্পেসিয়াল সিগন্যাল হতে পারে ... যেন আপনি কাগজের টুকরোতে সাইনাস তরঙ্গ আঁকেন, অক্ষটি ডানদিকে নির্দেশ করছে এবং y অক্ষটি লম্ব এক্স অক্ষ থেকে।

y (x) = sin (2πfx)

যেখানে f সিগন্যালের ফ্রিকোয়েন্সি এবং x হল স্পেসিয়াল ভেরিয়েবল। f এখানে আর 1 / s দিয়ে পরিমাপ করা হয় না, তবে 1 / (স্পেসের একক)।

একজন ফরাসী গণিতবিদ ফুরিয়ার দেখিয়েছেন যে আপনি বিভিন্ন বিভাজন এবং ফ্রিকোয়েন্সি সহ বেশ কয়েকটি সাইন এবং কোসাইন সংকেত যুক্ত করে যে কোনও সংকেত তৈরি করতে পারেন। এটাকে বলে ফুরিয়ার অ্যানালাইসিস।

ফুরিয়ার বিশ্লেষণ ব্যবহার করে যেকোন ফাংশন y (x) বিভিন্ন ফ্রিকোয়েন্সি সহ সাইন এবং কোসাইন সিগন্যালের সমষ্টি হিসাবে লেখা সম্ভব, সুতরাং একটি ফাংশন y (এক্স) ফ্রিকোয়েন্সি ওয়াই (চ) সম্পর্কিত বিভিন্ন ফাংশনের ক্ষেত্রে আবার লিখতে পারে। যে কেউ y (x) = কিছু_ফানশন (Y (f)) বলতে পারে। বা Y (f) = বিপরীত_সৌষ্ঠু_ফাঁস (y (x))

ফুরিয়ার ট্রান্সফর্মেশন হল ফাংশন F যা এক্স ডোমেইন থেকে ফ্রিকোয়েন্সি ডোমেনে সিগন্যাল রূপান্তর করে।

Y(f) = F( y(x) )

y(x) = F_inv(Y(f))

এফ একটি অ্যানালগ ফাংশন, ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্মেশন ডিএফটি হ'ল এফের সংখ্যাসূচক অনুমান Fast

ঠিক আছে...

দ্বিতীয় খণ্ড

এখন কম্পিউটারের চিত্রগুলি পিক্সেলের সমন্বয়ে গঠিত এবং প্রতিটি পিক্সেলের লাল, সবুজ, নীল ওরফে আরজিবি মানগুলির জন্য একটি তীব্রতা মান থাকে। গ্রেস্কেল চিত্রগুলিতে যে কোনও পিক্সেলের আর, জি, বি এর তীব্রতা সমান, আর = জি = বি = আমি তাই গ্রেস্কেল চিত্রগুলির জন্য আমি I সম্পর্কে কথা বলতে পারি can

নীচে 800px এক্স 100px গ্রেস্কেল ছবিটি I (x) = sin (2πfx) ব্যবহার করে তৈরি করা হয়েছিল যেখানে f = 1 পুনরাবৃত্তি / 800px = 0.00125 পুনরাবৃত্তি / px

এখানে চিত্র বর্ণনা লিখুন

পাইথন 3 দিয়ে আপনি নিজে এটি তৈরি করতে পারেন

from PIL import Image, ImageDraw
from math import sin, pi

img = Image.new('RGB', (800,100), color='black')
draw = ImageDraw.draw(img)

#cacluate the frequency
n = 10 #repetitions
f = n/img.width #

#iterate of the width pixels
for x in range(img.width):
 #calculate the intensity i in that pixel x
 y = sin(2*pi*f*x - pi/2) #this will generate values between -1 and +1, -pi/2 is to make sure that i starts with value 0 in the next line.
 i = (255+255*y)/2 #shifting and scaling y so that the values are between 0 and 255
 draw.line((i,0,i,img.height), fill=(int(i),int(i),int(i)))

img.show()

নীচে 800px এক্স 100px গ্রেস্কেল চিত্রটি I (x) = sin (2πfx) ব্যবহার করে তৈরি করা হয়েছিল যেখানে f = 10 পুনরায় প্রতিবেদন / 800px = 0.0125 পুনরাবৃত্তি / px

এখানে চিত্র বর্ণনা লিখুন

এখন এটি সহজেই দেখতে পাওয়া যায় যে এই চিত্রটির একটি অনুভূমিক ফ্রিকোয়েন্সি 10 রয়েছে। আসুন 10 এর একটি ফ্যাক্টর দ্বারা ফ্রিকোয়েন্সি বাড়িয়ে দিন, যাতে এন = 100. এফ = 100/800 = 1/8 = 0.125 পুনরাবৃত্তি / পিক্স:

এখানে চিত্র বর্ণনা লিখুন

পূর্বে উল্লিখিত হিসাবে, আপনি বিভিন্ন ফ্রিকোয়েন্সি সহ সাইন সিগন্যালের সমষ্টি সিরিজ (1 ডি গ্রেস্কেল সাইন ইমেজ) হিসাবে যে কোনও সংকেত (1 ডি গ্রেস্কেল চিত্র) উপস্থাপন করতে পারেন।

খণ্ড III

সুতরাং একটি 1 ডি গ্রেস্কেল চিত্র এ এর ​​আরও গ্রেস্কেল চিত্র বি এর চেয়ে বেশি ফ্রিকোয়েন্সি রয়েছে যদি A এর "সূক্ষ্ম" বিশদ থাকে।

আপনি সেই নীতিটি রঙিন 2D এমনকি 3 ডি চিত্রগুলিতে সাধারণীকরণ করতে পারেন। কোনও চিত্রের সূক্ষ্ম "বিবরণ" সেই চিত্রের ফ্রিকোয়েন্সি সামগ্রী যত বেশি থাকে।

সুতরাং একটি ফুলের চিত্রের তুলনায় নীল আকাশ কম ফ্রিকোয়েন্সি।

ফুরিয়ার অ্যানালাইসিস এবং ডিজিটাল চিত্র প্রক্রিয়াকরণ সম্পর্কে পড়ার মাধ্যমে আপনি এ সম্পর্কে আরও শিখতে পারেন।


4

সংক্ষেপে, ফ্রিকোয়েন্সি পরিবর্তনের হারকে বোঝায়। আরো সঠিকভাবে, ফ্রিকোয়েন্সি বিপরীত হয় সময়ের পরিবর্তন-যে এর সময় পরিমাণ এটা এক উজ্জ্বলতা (অথবা যাই হোক না কেন) একটি ভিন্ন উজ্জ্বলতা এবং ফিরে আবার থেকে চক্র লাগে। তারপরে তত দ্রুত পরিবর্তন হয় (উদাহরণস্বরূপ আলোক থেকে অন্ধকারে), চিত্রের সেই অংশটি উপস্থাপনের জন্য ভিজ্যুয়াল "ফ্রিকোয়েন্সি" তত বেশি হয়।

অন্য কথায়, আপনি কোনও চিত্রের ফ্রিকোয়েন্সিটিকে পরিবর্তনের হার হিসাবে ভাবতে পারেন। চিত্রের কিছু অংশ যা এক রঙ থেকে অন্য রঙে দ্রুত পরিবর্তিত হয় (যেমন ধারালো প্রান্ত) উচ্চ ফ্রিকোয়েন্সি ধারণ করে এবং যে অংশগুলি ধীরে ধীরে পরিবর্তিত হয় (উদাহরণস্বরূপ দৃ colors় রঙযুক্ত বৃহত পৃষ্ঠগুলি) কেবলমাত্র কম ফ্রিকোয়েন্সি ধারণ করে।

আমরা যখন ডিসিটি এবং এফএফটি এবং অন্যান্য অনুরূপ রূপান্তরগুলি নিয়ে কথা বলি, তখন আমরা সাধারণত এগুলি একটি চিত্রের অংশে করি (যেমন, জেপিইজি সংক্ষেপণ, প্রান্ত সনাক্তকরণ এবং এর জন্য)। এটি প্রদত্ত আকারের ট্রান্সফর্ম ব্লকের প্রসঙ্গে রূপান্তরগুলি সম্পর্কে কথা বলতে সবচেয়ে সার্থক করে তোলে ।

কল্পনা করুন, আপনি যদি করেন তবে একটি 32 পিক্সেল এক্স 32 চিত্রের ডেটা পিক্সেল ব্লক। (এই সংখ্যাটি নির্বিচারে)) ধরুন যে চিত্রটি একটি সাধারণ গ্রেডিয়েন্ট যা বামদিকে সাদা, মাঝখানে কালো এবং ডানদিকে সাদা। আমরা বলব যে এই সিগন্যালের একটি পিরিয়ড রয়েছে যার দৈর্ঘ্য 32 পিক্সেলের প্রায় এক তরঙ্গ দৈর্ঘ্য, কারণ এটি প্রতিটি 32 পিক্সেল পরে আবার সাদা থেকে সাদা থেকে একটি সম্পূর্ণ চক্রের মধ্য দিয়ে যায়।

আমরা নির্বিচারে এই ফ্রিকোয়েন্সিটিকে "1" - 32 চিক্সেল প্রতি 1 চক্র বলতে পারি that আমি অস্পষ্টভাবে মনে করতে পারি যে এটিকে সাধারণত trans রূপান্তর পাঠ্যপুস্তকগুলিতে, বা θ / 2 বলা যেতে পারে তবে আমি ভুল মনে রাখতে পারি। যে কোনও উপায়ে, আমরা এখনই এটির জন্য 1 বলব, কারণ এটি নিখুঁত অর্থে নির্বিচারে; যা গুরুত্বপূর্ণ তা হ'ল আপেক্ষিক অর্থে ফ্রিকোয়েন্সিগুলির মধ্যে সম্পর্ক। :-)

ধরুন আপনার একটি দ্বিতীয় চিত্র রয়েছে যা এক প্রান্তে সাদা, তারপরে দ্বিগুণ দ্রুত বিবর্ণ হয়ে গেছে যাতে এটি সাদা থেকে কালো, সাদা, কালো এবং আবার অন্য প্রান্তে আবার সাদা হয়ে যায়। আমরা তখন সেই ফ্রিকোয়েন্সিটিকে "2" বলব কারণ এটি 32 পিক্সেল ব্লকের প্রস্থের চেয়ে দ্বিগুণ পরিবর্তিত হয়।

যদি আমরা এই সাধারণ চিত্রগুলি পুনরুত্পাদন করতে চাইতাম, আমরা আক্ষরিকভাবে বলতে পারি যে প্রতিটি সারিটিতে 1 বা 2 এর ফ্রিকোয়েন্সি সহ একটি সংকেত থাকে এবং আপনি চিত্রগুলি দেখতে কেমন তা জানতে পারবেন। যদি চিত্রগুলি কালো থেকে 50% ধূসর হয়ে যায় তবে আপনি একই জিনিসটি করতে পারতেন তবে আপনাকে বলতে হবে যে 50% এর তীব্রতায় তাদের 1 বা 2 এর ফ্রিকোয়েন্সি ছিল।

বাস্তব-বিশ্বের চিত্রগুলি অবশ্যই কোনও সাধারণ গ্রেডিয়েন্ট নয়। বাম থেকে ডানে স্ক্যান করার সাথে সাথে চিত্রটি নিয়মিত পরিবর্তিত হয় এবং পর্যায়ক্রমে হয় না। তবে, একটি ছোট পর্যাপ্ত ব্লকের মধ্যে (উদাহরণস্বরূপ 8 পিক্সেল, 16 পিক্সেল) আপনি সারিগুলির পিক্সেলের মানগুলির গড় দিয়ে শুরু করে, পিক্সেলের এই সারিটিকে সংকেতের একটি সিরিজের সমষ্টি হিসাবে আনুমানিক করতে পারেন, তারপরে "পরিমাণের পরে" ফ্রিকোয়েন্সি 0.5 "সংকেত (একপাশে কালো, সাদা হয়ে যাওয়া সাদা) মিশ্রিত করতে (বা একটি নেতিবাচক পরিমাণের সাথে, বিয়োগের জন্য সেই সংকেতের পরিমাণ), তারপরে ফ্রিকোয়েন্সি 1, ফ্রিকোয়েন্সি 2, ফ্রিকোয়েন্সি 4, এবং আরও ।

এখন একটি চিত্র অনন্য যে এটি উভয় দিকের ফ্রিকোয়েন্সি রয়েছে; অনুভূমিকভাবে এবং উলম্বভাবে উভয় স্থানান্তরিত করার সময় এটি হালকা এবং গা get় হতে পারে। এই কারণে আমরা 1D এর পরিবর্তে 2D DCT বা FFT রূপান্তর ব্যবহার করি। তবে নীতিটি এখনও মূলত একই। আপনি একইভাবে আকারের বালতিগুলির একটি 8x8 গ্রিড সহ একটি 8x8 চিত্রটি স্পষ্টভাবে উপস্থাপন করতে পারেন।

রঙগুলির কারণে চিত্রগুলি আরও জটিল, তবে আমরা আপাতত এটিকে উপেক্ষা করব এবং ধরে নেব যে আমরা বিচ্ছিন্নভাবে কোনও ফটোগ্রাফের লাল চ্যানেলটি দেখে সম্ভবত একটি একক গ্রেস্কেল চিত্রটি দেখছি।

ট্রান্সফর্মের ফলাফলগুলি কীভাবে পড়বেন তা নির্ভর করে আপনি 1D ট্রান্সফর্ম বা 2 ডি রূপান্তর দেখছেন কিনা তার উপর নির্ভর করে। 1D ট্রান্সফর্মের জন্য, আপনার কাছে বিন্যাসের একটি সিরিজ রয়েছে। প্রথমটি সমস্ত ইনপুট মানগুলির গড় of দ্বিতীয়টি হ'ল ফ্রিকোয়েন্সি 1 সংকেত যোগ করার পরিমাণ, তৃতীয়টি সংযোজন 2 সংকেতের পরিমাণ ইত্যাদি যোগ করা ইত্যাদি is

2 ডি ট্রান্সফর্মের জন্য আপনার মানগুলির একটি এন x এন গ্রিড রয়েছে। উপরের বামটি সাধারণত সেই গড় হয় এবং আপনি যখন অনুভূমিক দিকের দিকে যান, প্রতিটি বালতিতে 1, 2, 4 ইত্যাদি অনুভূমিক ফ্রিকোয়েন্সি মিশ্রিত হওয়ার জন্য সংকেত পরিমাণ থাকে এবং আপনি উল্লম্ব দিকে যেতে যেতে এটি 1, 2, 4, ইত্যাদির উল্লম্ব ফ্রিকোয়েন্সি সহ মিশ্রিত সংকেতের পরিমাণ

এটি অবশ্যই, আপনি যদি কোনও ডিসিটির কথা বলছেন তবে সম্পূর্ণ গল্পটি; বিপরীতে, একটি এফএফটি জন্য প্রতিটি বিন বাস্তব এবং কাল্পনিক অংশ রয়েছে। এফএফটি এখনও একই বেসিক আইডিয়া (সাজানো) এর উপর ভিত্তি করে রয়েছে, ব্যতীত ফ্রিকোয়েন্সিগুলি বিনের সাথে ম্যাপ করার পদ্ধতিটি পৃথক এবং গণিতটি চুলচেরা। :-)

অবশ্যই, এই ধরণের রূপান্তরগুলি তৈরি করার সর্বাধিক সাধারণ কারণ হ'ল তারপরে আরও এক ধাপ এগিয়ে গিয়ে কিছু ডেটা ফেলে দেওয়া। উদাহরণস্বরূপ, জেপিইজি সংকোচনে ডিসিটি ব্যবহৃত হয়। উপরের বাম (গড়) দিয়ে শুরু করে এবং ডানদিকে ডান দিকে অগ্রসর হওয়া একটি জিগ-জাগ প্যাটার্নে মানগুলি পড়ার পরে, সর্বাধিক গুরুত্বপূর্ণ ডেটা (গড় এবং নিম্ন-ফ্রিকোয়েন্সি তথ্য) প্রথমে রেকর্ড হয় এবং তারপরে ক্রমবর্ধমান উচ্চ ফ্রিকোয়েন্সি ডেটা হয়। কিছু পর্যায়ে আপনি মূলত "এটি যথেষ্ট ভাল" বলে এবং সর্বোচ্চ-ফ্রিকোয়েন্সি ডেটা ফেলে দেয়। এটি মূলত এর সূক্ষ্ম বিশদটি ফেলে দিয়ে চিত্রটিকে মসৃণ করে, তবে এখনও আপনাকে প্রায় সঠিক চিত্র দেয়।

এবং আইআইআরসি, এফএফটিগুলি কখনও কখনও প্রান্ত সনাক্তকরণের জন্যও ব্যবহৃত হয়, যেখানে আপনি উচ্চতর ফ্রিকোয়েন্সি উপাদানগুলিকে তীক্ষ্ণ প্রান্তগুলিতে উচ্চ বিপরীতের ক্ষেত্রগুলি সনাক্ত করার উপায় হিসাবে ফেলে দেন।

জাতীয় উপকরণগুলির একটি দুর্দান্ত নিবন্ধ রয়েছে যা এটি চিত্র সহ ব্যাখ্যা করে। :-)


0

ফটোসেলের সাথে লাইনে স্ক্যান করে ছবিটি স্ক্যান করে, এবং ফলাফলগুলি কোনও প্লটকারকে খাওয়ান (এই ফ্ল্যাট মেশিনগুলি যা কাগজে কালো wavesেউ তোলে os সবুজ বা বহু রঙের পিকেট বেড়া তৈরি করুন)। বা একটি লাউড স্পিকার এমনকি। কোনও চিত্রের সূক্ষ্ম কাঠামো, দেখানো / শোনার সংকেতের উচ্চতর ফ্রিকোয়েন্সি (লাউডস্পিকারের পিচ) বেশি হবে। সূক্ষ্ম কাঠামোর মধ্যে যত বেশি বিপরীততা রয়েছে, তত বেশি সংখ্যার উচ্চ ফ্রিকোয়েন্সি অংশগুলির প্রশস্ততা হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.