একাধিক পরীক্ষার জন্য পি মানগুলি সংশোধন করা হচ্ছে যেখানে পরীক্ষাগুলি পরস্পর সম্পর্কিত হয় (জিনেটিক্স)


24

আমার অনেকগুলি পরীক্ষার থেকে পি মান রয়েছে এবং একাধিক পরীক্ষার জন্য সংশোধন করার পরে বাস্তবে উল্লেখযোগ্য কিছু আছে কিনা তা জানতে চাই। জটিলতা: আমার পরীক্ষাগুলি স্বাধীন নয়। আমি যে পদ্ধতিটি সম্পর্কে ভাবছি (ফিশারের পণ্য পদ্ধতির একটি বৈকল্পিক, জায়কিন এট আল, জেনেট এপিডেমিওল , ২০০২) পি মানগুলির মধ্যে পারস্পরিক সম্পর্ক প্রয়োজন।

এই পারস্পরিক সম্পর্কটি অনুমান করার জন্য, আমি বর্তমানে বুটস্ট্র্যাপিং ক্ষেত্রে, বিশ্লেষণগুলি চালাচ্ছি এবং পি মানগুলির ফলাফলের ভেক্টরগুলিকে সংযুক্ত করে তুলছি। কারও কি আরও ভাল ধারণা আছে? অথবা আমার মূল সমস্যার জন্য আরও ভাল ধারণা (সংযুক্ত টেস্টে একাধিক পরীক্ষার জন্য সংশোধন করা)?

পটভূমি: আমার বিষয়গুলি তাদের জিনোটাইপ (এএ, আ এবং আ) এবং একটি কোভারিয়েটের মধ্যে মিথস্ক্রিয়ায় কোনও বিশেষ রোগে ভুগছে কিনা তা আমি যুক্তিবাদীভাবে চাপ দিচ্ছি। যাইহোক, জিনোটাইপটি আসলে একক নিউক্লিওটাইড পলিমারফিজমগুলির (এসএনপি) অনেকগুলি (30-250), যা অবশ্যই স্বাধীন নয় তবে লিঙ্কেজ ডাইসেকিলিব্রিয়ামে রয়েছে।

উত্তর:


29

এটি আসলে জিনোমাইডওয়ালাইসিস অ্যানালাইসিস স্টাডিজ (জিডাব্লুএএস) এর একটি উত্তপ্ত বিষয়! আমি নিশ্চিত নই যে আপনি যে পদ্ধতিটির কথা ভাবছেন সেটি এই প্রসঙ্গে সবচেয়ে উপযুক্ত। পি-ভ্যালুগুলির পুলিং কিছু লেখক বর্ণনা করেছিলেন তবে ভিন্ন প্রসঙ্গে (প্রতিলিপি অধ্যয়ন বা মেটা-বিশ্লেষণ, উদাহরণস্বরূপ (1) সাম্প্রতিক পর্যালোচনার জন্য) দেখুন। ফিশারের পদ্ধতি দ্বারা এসএনপি পি-মানগুলির সংমিশ্রণ সাধারণত ব্যবহৃত হয় যখন কেউ প্রদত্ত জিনের জন্য একটি অনন্য পি-মান অর্জন করতে চায়; এটি জিন স্তরে কাজ করতে দেয় এবং পরবর্তী পরীক্ষার মাত্রিকতার পরিমাণ হ্রাস করতে পারে, তবে আপনি যেমন বলেছিলেন যে চিহ্নিতকারীদের মধ্যে অ-স্বাধীনতা (স্থানিক সমষ্টি বা সংযোগ বিচ্ছিন্নতা, এলডি থেকে উদ্ভূত) একটি পক্ষপাতিত্ব প্রবর্তন করে। আরও শক্তিশালী বিকল্প পুনর্নির্মাণের পদ্ধতিগুলির উপর নির্ভর করে,

বুটস্ট্র্যাপিং (প্রতিস্থাপনের সাথে) নিয়ে আমার প্রধান উদ্বেগটি হ'ল আপনি সম্পর্কিততার একটি কৃত্রিম রূপ প্রবর্তন করছেন, বা অন্য কথায় আপনি ভার্চুয়াল যমজ তৈরি করেন, তাই হার্ডি-ওয়েইনবার্গের ভারসাম্যকে পরিবর্তন করে (তবে ন্যূনতম অ্যালিল ফ্রিকোয়েন্সি এবং কল রেট)। আপনি পৃথক লেবেলগুলিকে অনুমতি দেন এবং জিনোটাইপিং ডেটা যেমন রাখেন তেমন কোনও অনুচ্ছেদ পদ্ধতির ক্ষেত্রে এটি ঘটবে না। সাধারণত, প্লিংক সফ্টওয়্যারটি আপনাকে কাঁচা এবং অনুমতিযুক্ত পি-মান দিতে পারে, যদিও এটি (ডিফল্টরূপে) একটি স্লাইডিং উইন্ডো সহ একটি অভিযোজিত পরীক্ষামূলক কৌশল ব্যবহার করে যা সমস্ত ক্রিয়াকলাপগুলি (এসএনপি অনুযায়ী 1000 বলুন) চালানো বন্ধ করতে দেয় যদি এটি প্রদর্শিত হয় যে এসএনপি এর অধীনে রয়েছে বিবেচনা "আকর্ষণীয়" নয়; এটিতে ম্যাক্সটি কম্পিউটিংয়ের বিকল্পও রয়েছে, অনলাইন সহায়তা দেখুন

তবে আপনি বিবেচনা করছেন এমন কম সংখ্যক এসএনপি দেওয়া, আমি মাল্টেস্ট আর প্যাকেজের (দেখুন mt.maxT) প্রয়োগকৃত এফডিআর-ভিত্তিক বা সর্বাধিক পরীক্ষার উপর নির্ভর করার পরামর্শ দিচ্ছি , তবে জিনোমিক অ্যাপ্লিকেশনটির পুনর্নির্মাণের কৌশলগুলির চূড়ান্ত গাইডটি হ'ল অ্যাপ্লিকেশনগুলির সাথে একাধিক পরীক্ষার পদ্ধতি জিনোমিক্স , ডুডোইট এবং ভ্যান ডার লান (স্প্রঞ্জার, ২০০৮) থেকে। জেএসএসে পর্যালোচনা করা আর এর সাথে জেনেটিক্স সম্পর্কিত অ্যান্ড্রিয়া ফলকসের বইটিও দেখুন । একাধিক পরীক্ষার পদ্ধতিতে তার দুর্দান্ত উপাদান রয়েছে।

আরও নোট

অনেক লেখক এই বিষয়টির দিকে ইঙ্গিত করেছেন যে বনফেরোনি বা সিডাকের মতো সাধারণ একাধিক পরীক্ষার সংশোধন পদ্ধতি পৃথক এসএনপিগুলির জন্য ফলাফলগুলি সামঞ্জস্য করার জন্য খুব কঠোর। তদুপরি, এই পদ্ধতির কোনওটিই এলডি-র কারণে এসএনপিগুলির মধ্যে বিদ্যমান পারস্পরিক সম্পর্ককে বিবেচনায় নেয় না যা জিন অঞ্চলগুলিতে জিনগত প্রকরণকে ট্যাগ করে। অন্যান্য বিকল্পগুলি মৌলিক প্রস্তাবিত হয়েছে যেমন একাধিক তুলনা (3), লুকানো মার্কভ মডেল (4), শর্তসাপেক্ষ বা ইতিবাচক এফডিআর (5) বা এর (6) এর ডেরিভেটিভের জন্য কয়েকটি নামকরণের জন্য হোলমের পদ্ধতির ডেরাইভেটিভের মতো। তথাকথিত ব্যবধানের পরিসংখ্যান বা স্লাইডিং উইন্ডো কোনও ক্ষেত্রে সফল প্রমাণিত হয়েছে, তবে আপনি (7) এবং (8) এ একটি ভাল পর্যালোচনা পাবেন।

আমি এমন পদ্ধতিগুলির কথাও শুনেছি যা হ্যাপ্লোটাইপ কাঠামো বা এলডি, যেমন (9) এর কার্যকর ব্যবহার করে তবে আমি সেগুলি কখনও ব্যবহার করি নি। তারা মনে হয়, পি-ভ্যালু নয়, চিহ্নিতকারীদের মধ্যে পারস্পরিক সম্পর্কের অনুমানের সাথে আরও সম্পর্কিত seem তবে প্রকৃতপক্ষে, আপনি পারস্পরিক পরীক্ষার পরিসংখ্যানগুলির মধ্যে নির্ভরশীল কাঠামোর ক্ষেত্রে পারস্পরিক সম্পর্কযুক্ত পি-মানগুলির চেয়ে আরও ভালভাবে ভাবতে পারেন।

তথ্যসূত্র

  1. ক্যান্টর, আরএম, ল্যাঞ্জ, কে এবং সিনশিমার, জেএস। জিডাব্লুএএস ফলাফলগুলিকে প্রাধান্য দেওয়া: তাদের প্রয়োগের জন্য পরিসংখ্যানগত পদ্ধতি এবং সুপারিশগুলির একটি পর্যালোচনা । আমি জে হুম জিনেট। 2010 86 (1): 6-22।
  2. করলি, আরপি, জেইগার, জেএস, ক্রোলি, টি এট আল। বয়ঃসন্ধিকালে অসামাজিক dependষধ নির্ভরতা সহ প্রার্থী জিনদের সমিতি । ড্রাগ এবং অ্যালকোহল নির্ভরতা ২০০ 96 96: 90-98।
  3. ডালমাসো, সি, গ্যানিন, ই এবং ট্রাগুয়েট ডিএ। জিনোমডওয়াইড অ্যাসোসিয়েশন স্টাডিজের অ্যাললে ফ্রিকোয়েন্সিগুলির জন্য একটি ওয়েট-হোল প্রক্রিয়া অ্যাকাউন্টিং । জেনেটিক্স 2008 180 (1): 697–702।
  4. ওয়েই, টু Z, সূর্য, পঃ, ওয়াং, কে, এবং Hakonarson, এইচ লুকানো মার্কভ মডেল মাধ্যমে জিনোম-যে ব্যাপক চর্চা একাধিক টেস্টিং । বায়োইনফরম্যাটিকস 25 25 (21): 2802-2808।
  5. ব্রোবার্গ, পি । অনুপাত অপরিবর্তিত জিন এবং মিথ্যা আবিষ্কারের হারের অনুমানের তুলনামূলক পর্যালোচনা । বিএমসি বায়োইনফরম্যাটিকস 2005 6: 199।
  6. প্রয়োজন, এসি, জি, ডি, ওয়েল, এমই, এবং এ। সিজোফ্রেনিয়ায় এসএনপি এবং সিএনভিগুলির একটি জিনোম-ওয়াইড তদন্ত । পিএলওএস জিনেট। ২০০৯ 5 (2): e1000373।
  7. হান, বি, কং, এইচএম, এবং এসকিন, ই। র‌্যাপিড এবং নির্ভুল একাধিক পরীক্ষার সংশোধন এবং মিলিয়ন মিলিয়ন সম্পর্কিত চিহ্নিতকারীদের পাওয়ার অনুমান । পিএলওএস জেনেটিক্স ২০০৯
  8. লিয়াং, ওয়াই এবং ক্যালেমেন, এ । জটিল রোগগুলির জিনোমিক স্টাডিতে পারস্পরিক সম্পর্কযুক্ত উচ্চ মাত্রিক স্ন্যাপ তথ্য বিশ্লেষণের জন্য পরিসংখ্যানগত অগ্রগতি এবং চ্যালেঞ্জগুলি । পরিসংখ্যান জরিপ 2008 2: 43-60। - সর্বকালের সর্বকালের সেরা পর্যালোচনা
  9. নিহোল্ট, ডিআর। একে অপরের সাথে লিঙ্কেজ ডাইসিলাইব্রিয়ামের একক-নিউক্লিওটাইড পলিমॉर्ফিজমের একাধিক পরীক্ষার জন্য একটি সহজ সংশোধন । আমি জে হুম জিনেট। 2004 74 (4): 765–769।
  10. নিকোডেমাস, কে, লিউ, ডাব্লু, চেজ, জিএ, সসাই, ওয়াইওয়াই, এবং ফ্যালিন, এমডি। হ্যাপ্লোটাইপ ব্লকিং অ্যালগরিদম বনাম মূল উপাদানগুলি ব্যবহার করে বৃহত একক নিউক্লিওটাইড পলিমॉर्फিজম স্টাডিজে একাধিক পরীক্ষা সংশোধনের জন্য টাইপ প্রথম ত্রুটির তুলনা । বিএমসি জেনেটিক্স 2005; 6 (suppl 1): এস 78।
  11. পেঙ্গ, কিউ, ঝাও, জে এবং জিউ, এফ। পিসিএ ভিত্তিক বুটস্ট্র্যাপের আত্মবিশ্বাসের ইন্টারভাল টেস্টগুলি একাধিক এসএনপি জড়িত জিন-ডিজাইনের সংস্থার জন্য । বিএমসি জেনেটিকস 2010, 11: 6
  12. লি, এম, রোমেরো, আর, ফু, ডব্লিউজে এবং কুই, ওয়াই (2010)। অভিযোজিত লাসো-র সাথে ম্যাপিং হ্যাপ্লোটাইপ-হ্যাপ্লোটাইপ ইন্টারঅ্যাকশন । বিএমসি জেনেটিকস ২০১০, ১১:79৯ - যদিও সরাসরি প্রশ্নের সাথে সম্পর্কিত নয়, এটি হ্যাপ্লোটাইপ-ভিত্তিক বিশ্লেষণ / এপিস্ট্যাটিক এফেক্টটি কভার করে

1
বাহ, এই সমস্ত সমস্যায় যাওয়ার জন্য ধন্যবাদ! আমি বুটস্ট্র্যাপিং সম্পর্কে আপনার যোগ্যতা বুঝতে পারি এবং আমি প্রায় নিশ্চিত convinced আমি মনে করি যে আমার মূল জটিলতাটি আমার কাছে সংখ্যাসূচক কোভারিয়েট যা অবশ্যই অবশ্যই প্রয়োজনীয় হবে (তা নিজেই বা জিনোটাইপের সাথে মিথস্ক্রিয়ায়), এবং এটি এমটি.ম্যাক্সটি এবং প্লিংককে প্রত্যাখ্যান করে বলে মনে হয়, যদিও আমাকে আবার প্লিংক দেখার প্রয়োজন হতে পারে। তবে আপনার দেওয়া রেফারেন্সগুলি আমি অবশ্যই খনন করব!
এস। কোলাসা - মনিকা 15

আপনি আপনার জিএলএমের অবশিষ্টাংশের সাথে সর্বদা আপনার সহযাত্রীদের যাত্রা করতে কাজ করতে পারেন, যদিও আপনি কিছু ডিএফ হারিয়েছেন যা অ্যাকাউন্ট করা বা পরে পুনঃপ্রবর্তন করা কঠিন হবে (যেমন পি-মান গণনা করার জন্য)।
chl

এইচএম, আমার লজিস্টিক রিগ্রেশন থেকে অবশিষ্টাংশগুলি? এটা কি বৈধ হবে?
এস। কোলাসা - মনিকা

হ্যাঁ, না কেন? অন্যান্য কোভারিয়েটদের দ্বারা গণ্য করা বৈকল্পিকতা মুছে ফেলা এবং তারপরে আপনার অবশিষ্ট তথ্যগুলির সাথে দ্বিতীয় স্তরের বিশ্লেষণে এগিয়ে যাওয়া অস্বাভাবিক কিছু নয় is এটা প্রায়ই দ্রুত (করেছে, যেমন, ঠং, বেশ শ্রেণীগত covariates সঙ্গে ধীর থাকাকালীন এটা ক্রমাগত বেশী সাথে ঠিক আছে snpMatrixবা শুধু glm()সঞ্চালিত বেশ এই পয়েন্ট ভাল কিন্তু আপনি মধ্যে SNPs অনেকটা এম্বেড করা যাবে না glm()...); সমস্যাটি হ'ল আপনার ২ য় বিশ্লেষণের শেষে সংশোধিত পি-মান পাওয়া বরং জটিল (কারণ আপনাকে ইতিমধ্যে অনুমিত প্যারামিটারগুলির জন্য অ্যাকাউন্ট করতে হবে)।
chl

লোকেরা কীভাবে অবশিষ্টাংশের সাথে কাজ করছে তার উদাহরণের জন্য উদাহরণস্বরূপ দেখুন পি। হেক এট আল এর 466। ব্যক্তিত্বের বৈশিষ্ট্যগুলির জন্য 17 প্রার্থী জিনের তদন্ত অভিনবত্বের সন্ধানে এইচটিআর 2 এ জিনের প্রভাবগুলি নিশ্চিত করে। জিন, মস্তিষ্ক এবং আচরণ (২০০৯) খণ্ড। 8 (4) পিপি 464-72
chl

2

বনফেরনির মতো কোনও পদ্ধতি ব্যবহার করা ভাল, সমস্যাটি হ'ল আপনার যদি অনেক পরীক্ষা করে থাকে তবে আপনার অনেকগুলি "আবিষ্কার" পাওয়া সম্ভব হয় না।

আপনি নির্ভরশীল পরীক্ষাগুলির জন্য এফডিআর পদ্ধতির সাথে যেতে পারেন ( বিশদগুলির জন্য এখানে দেখুন ) সমস্যাটি হ'ল আমি নিশ্চিত নই যে আপনার পারস্পরিক সম্পর্কগুলি যদি ইতিবাচক হয় তবে আপনি অবশ্যই সামনে বলতে পারবেন কিনা।

আর এ আপনি পি এডজাস্টের সাহায্যে সাধারণ এফডিআর করতে পারেন। আরও জটিল জিনিসের জন্য আমি মাল্টকম্পটি একবার দেখে নেব , তবে নির্ভরতার ক্ষেত্রে সমাধানের জন্য আমি এর মধ্য দিয়ে যাইনি।

শুভকামনা।


1
হাই তাল, ধন্যবাদ! বোনফেরোনি আমার কাছে উপযুক্ত বলে মনে হয় না - যদি আমার এসএনপিগুলির মধ্যে একটি কার্যকরী হয় এবং অন্যরা এর সাথে যুক্ত থাকে তবে একটি সংকেত থাকা উচিত, এবং বোনফেরনির সবসময় আমার কাছে খুব রক্ষণশীল মনে হয়েছিল (আমি সাধারণত হলমের পদক্ষেপ সংশোধন পছন্দ করি)। আপনি যে এফডিআরের সাথে লিঙ্ক করেছেন এবং পি.ডি.ডিজেড সম্মিলিত প্রমাণ বিবেচনা করবেন না (এবং এফডিআর এখনও আমার পরীক্ষার, মূল প্রশ্নটির পারস্পরিক সম্পর্ক বোঝার প্রয়োজন)) মাল্টকম্প সাহায্য করতে পারে, যদিও প্রথম নজরে মনে হয় এটি একক মডেলের মধ্যে একাধিক পরীক্ষার সাথে আরও বেশি ডিল করে , যেখানে আমার একাধিক মডেল রয়েছে। আমি আরও গভীর খনন করব ...
এস। কোলাসা - সোনার

হ্যালো স্টিফান আমি বুঝতে পারি, আরও সাহায্য না করার জন্য দুঃখিত। শুভকামনা! তাল
তাল গালিলি

হ্যালো স্টিফান, আমি এখনও মনে করি আপনি এখনও টাল দ্বারা নির্দেশিত হিসাবে পি-অ্যাডজাস্টে পদ্ধতি = বিওয়াই (বেনজামিনী হচবার্গ ইয়েকুটেলি প্রক্রিয়াটির জন্য) ব্যবহার করতে পারেন। অবশ্যই, Bonferroni ব্যবহার রক্ষণশীল হতে পারে।
সানকুলসু

সানকুলসু, আমি মনে করি যে এই পদ্ধতিটি তখনই কার্যকর হয় যখন ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ক ইতিবাচক (নেতিবাচক নয়) হয়। চিয়ার্স।
তাল গ্যালি

2

আমি মনে করি মাল্টিভারিয়েট নরমাল মডেলগুলি সংযুক্ত পি-মানগুলি মডেল করতে এবং সঠিক ধরণের একাধিক পরীক্ষার সংশোধন পেতে ব্যবহার করা হচ্ছে। মিলিয়ন মিলিয়ন সম্পর্কযুক্ত চিহ্নিতকারীদের জন্য দ্রুত এবং সঠিক একাধিক পরীক্ষার সংশোধন এবং পাওয়ার অনুমান। পিএলওএস জেনেট ২০০৯ তাদের সম্পর্কে কথা বলে এবং অন্যান্য উল্লেখও দেয়। এটি আপনি যে বিষয়ে কথা বলছিলেন তার সমান মনে হয়, তবে আমি মনে করি আরও সঠিক বিশ্বব্যাপী পি-মান সংশোধন করা ছাড়াও, এলডি কাঠামোর জ্ঞানটি কার্যকারক চিহ্নিতকারীদের সাথে সম্পর্কযুক্ত মার্কারগুলি থেকে উদ্ভূত উদ্দীপক ইতিবাচক অপসারণের জন্যও ব্যবহার করা উচিত।


2

ঠিক ঠিক একই সমস্যার জন্য আমি একটি কাজের সমাধান খুঁজছি। সবচেয়ে ভাল আমি খুঁজে পেয়েছি হ'ল ফলকস অ্যান্ড্রেয়া তার অ্যাপ্লাইড স্ট্যাটিস্টিকাল জেনেটিকস উইথ আর (২০০৯) বইয়ের মধ্যে নল অ্যার্রিট্রিক্টেড বুটস্ট্র্যাপ চালু করেছিলেন । তিনি অন্যান্য নিবন্ধ এবং বইগুলির সমস্ত গোষ্ঠীর বিপরীতে তিনি বিশেষভাবে সংবেদনগুলি বিবেচনা করেন। অন্যান্য পদ্ধতির পাশাপাশি তিনি নাল অব্যাহত বুটস্ট্র্যাপকে পরামর্শ দেন, এটি উপযুক্ত যেখানে কেউ সহজেই অবশিষ্টাংশগুলি গণনা করতে পারবেন না (যেমন আমার ক্ষেত্রে, যেখানে আমি অনেকগুলি স্বাধীন রেজিস্ট্রেশন (মূলত সহজ সম্পর্ক)), প্রত্যেকটির একই প্রতিক্রিয়া পরিবর্তনশীল এবং বিভিন্ন স্নিপ সহ মডেল করি )। আমি এই পদ্ধতিটি ম্যাক্সটি পদ্ধতিও বলেছি found

> attach(fms)
> Actn3Bin <- > data.frame(actn3_r577x!="TT",actn3_rs540874!="AA",actn3_rs1815739!="TT",actn3_1671064!="GG")
> Mod <- summary(lm(NDRM.CH~.,data=Actn3Bin))
> CoefObs <- as.vector(Mod$coefficients[-1,1]) 
> B <-1000
> TestStatBoot <- matrix(nrow=B,ncol=NSnps)
> for (i in 1:B){
+    SampID <- sample(1:Nobs,size=Nobs, replace=T)
+    Ynew <- NDRM.CH[!MissDat][SampID]
+    Xnew <- Actn3BinC[SampID,]
+    CoefBoot <- summary(lm(Ynew~.,data=Xnew))$coefficients[-1,1]
+    SEBoot <- summary(lm(Ynew~.,data=Xnew))$coefficients[-1,2]
+    if (length(CoefBoot)==length(CoefObs)){
+       TestStatBoot[i,] <- (CoefBoot-CoefObs)/SEBoot
+    }
+ }

TestStatBootটি*^টিCrit।α=0.05টি*^টিCrit।

আমিটিআমি^>টিCrit।

এই কোডটি দিয়ে শেষ পদক্ষেপটি সম্পাদন করা যায়

p.value<-0.05 # The target alpha threshold
digits<-1000000
library(gtools) # for binsearch

pValueFun<-function(cj)
{
   mean(apply(abs(TestStatBoot)>cj/digits,1,sum)>=1,na.rm=T)
}
ans<-binsearch(pValueFun,c(0.5*digits,100*digits),target=p.value)
p.level<-(1-pnorm(q=ans$where[[1]]/digits))*2 #two-sided.
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.