HESAPLAMALI FİLOGENETİK

Hesaplamalı filogenetik, hesaplama algoritmalarının, yöntemlerinin ve programlarının filogenetik analizlere uygulanmasıdır. Amaç, bir dizi  genin, türün veya diğer taksonların evrimsel ataları hakkında bir hipotezi temsil eden bir filogenetik ağaç oluşturmaktır . Örneğin, bu teknikler hominid türlerin soy ağacını [1] ve birçok organizmanın paylaştığı spesifik genler arasındaki ilişkileri araştırmak için kullanılmıştır. [2] Geleneksel filogenetik,  fenotipik ölçülerek ve ölçülerek elde edilen morfolojik verilere dayanırdaha yeni moleküler filogenetik alanı, sınıflandırma için proteinleri kodlayan genleri veya  amino asit sekanslarını kodlayan nükleotit sekanslarını kullanır . Moleküler filogenetiklerin birçok biçimi , ıraksak türlerin genomlarında temsil edilen homolog genler arasındaki evrimsel ilişkileri sınıflandırmak için kullanılan filogenetik ağaçların oluşturulmasında ve rafine edilmesinde sekans hizalaması ile yakından ilişkilidir ve bunlardan kapsamlı olarak yararlanır . Hesaplama yöntemleriyle inşa edilen filogenetik ağaçların evrim ağacını mükemmel bir şekilde üretmesi olası değildir. Analiz edilen türler arasındaki tarihsel ilişkileri temsil eder. Tarihi türler ağacı, bu türler tarafından paylaşılan bireysel homolog bir genin tarihi ağacından da farklı olabilir.

FİLOGENETİK AĞAÇ VE AĞ TÜRLERİ  

Hesaplamalı filogenetik tarafından üretilen filogenetik ağaçlar , girdi verilerine ve kullanılan algoritmaya bağlı olarak köklü veya  köksüz olabilir. Köklü bir ağaç , genellikle girişte temsil edilmeyen, örtülü bir sıra olan en son ortak atayı (MRCA) açıkça tanımlayan  yönlendirilmiş bir grafiktir . Genetik uzaklık ölçümleri, bir ağacı yaprak düğümleri olarak giriş dizileri ve bunların kökten uzaklıkları , varsayılmış MRCA’dan genetik uzaklıkları ile orantılı olarak çizmek için kullanılabilir . Bir kökün tanımlanması genellikle, ilgilenilen sekanslarla sadece uzak ilişkili olduğu bilinen en az bir “dış grubun” girdi verilerine dahil edilmesini gerektirir.

Buna karşılık, köklenmemiş ağaçlar, giriş dizileri arasındaki mesafeleri ve ilişkileri, inişlerine ilişkin varsayımlar yapmadan çizer.  Köklendirilmemiş bir ağaç her zaman köklü bir ağaçtan üretilebilir, ancak kök köklü bir ağaca moleküler saat hipotezi varsayımı gibi sapma oranları hakkında ek veri olmadan genellikle yerleştirilemez . [3]

Belirli bir girdi dizisi grubu için olası tüm filogenetik ağaçların kümesi, arama yollarının optimizasyon algoritmaları ile izlenebildiği, ayrı ayrı tanımlanmış çok boyutlu bir “ağaç alanı” olarak kavramsallaştırılabilir . Önemsiz sayıda girdi dizisi için toplam ağaç sayısını saymak, bir ağaç topolojisinin tanımındaki değişimlerle karmaşıklaşabilse de, belirli sayıda girdi ve parametre seçimi için köklenmemiş ağaçlardan daha köklü olduğu her zaman doğrudur. [4]

Hem köklü hem de köklenmemiş filogenetik ağaçlar, hibridizasyon veya yatay gen transferi gibi evrimsel fenomenlerin modellenmesine izin veren köklü veya köksüz filogenetik ağlara da genelleştirilebilir .

KARAKTERLERİ KODLAMA VE HOMOLOJİ TANIMLAMA  

MORFOLOJİK ANALİZ 

Morfolojik filogenetikteki temel problem bir matrisin birleştirilmesidir. Sınıflandırıcı olarak kullanılan fenotipik özelliklerin her biri için temsili ölçümlerle karşılaştırılan taksonların her birinden bir haritalamayı temsil eder. Bu matrisi oluşturmak için kullanılan fenotipik veri türleri, karşılaştırılan taksonlara bağlıdır; bireysel türler için, ortalama vücut büyüklüğünün, belirli kemiklerin uzunluklarının veya boyutlarının veya diğer fiziksel özelliklerin, hatta davranışsal belirtilerin ölçümlerini içerebilirler. Elbette, olası her fenotipik özellik analiz için ölçülemediği ve kodlanamadığı için, hangi özelliklerin ölçüleceği yöntemin yöntemin önünde önemli bir engel olduğunu göstermektedir. Matris için temel olarak hangi özelliklerin kullanılacağına karar verilmesi, bir türün veya daha yüksek taksonun özelliklerinin evrimsel olarak alakalı olduğu hipotezini temsil eder. [5]Morfolojik çalışmalar fenotiplerin yakınsak evrimi örnekleri ile karıştırılabilir . [6] yararlı sınıfları inşa büyük bir meydan okuma Fenotip en varyasyon dağılımında arası takson örtüşme olasılığı yüksektir. Soyu tükenmiş taksonların morfolojik analize dahil edilmesi genellikle fosil kayıtlarının olmaması veya eksik olması nedeniyle zordur , ancak üretilen ağaçlar üzerinde önemli bir etkisi olduğu gösterilmiştir; bir çalışmada sadece soyu tükenmiş maymun türlerinin dahil edilmesi, moleküler verilerden üretilenle tutarlı morfolojik olarak türetilmiş bir ağaç üretti. [1]

Bazı fenotipik sınıflamalar, özellikle çok çeşitli takson gruplarını analiz ederken kullanılanlar, ayrık ve açıktır; organizmaları bir kuyruğa sahip veya eksik olarak sınıflandırmak, vakaların çoğunda, gözler veya omurlar gibi özellikleri saymak gibi basittir. Bununla birlikte, sürekli değişen fenotipik ölçümlerin en uygun temsili, genel bir çözümü olmayan tartışmalı bir sorundur. Yaygın bir yöntem, sadece ilgili ölçümleri iki veya daha fazla sınıfa ayırmak, sürekli gözlenen varyasyonu ayrı olarak sınıflandırılabilir kılmaktır (örneğin, belirli bir kesimden daha uzun humerus kemiklerine sahip tüm örnekler bir durumun üyeleri ve humerusları olan tüm üyeler kemikler, ikinci bir durumun üyeleri olarak skordan daha kısadır). Bu, kolayca manipüle edilebilirveri seti olmakla birlikte, ölçümlerin sürekli ağırlıklı dağılımını kullanan yöntemlere kıyasla sınıf tanımlarının temelinin yetersiz raporlanması ve bilgilerin feda edilmesi nedeniyle eleştirilmiştir. [7]

Morfolojik veriler, ister literatür kaynaklarından isterse saha gözlemlerinden, toplanması son derece emek-yoğun olduğundan, daha önce derlenmiş veri matrislerinin yeniden kullanımı nadir değildir, ancak bu, orijinal matristeki kusurları çoklu türev analizlerine yayabilir. [8]

MOLEKÜLER ANALİZ 

Farklı – Biyolojik dizi verilerinin karakterler acil ve ayrı ayrı tanımlanmış olduğu gibi bir karakter kodlama problemi, moleküler analizlerde çok farklı  nükleotid içinde , DNA ya da RNA dizilerinin ve farklı amino asitlerin içinde protein dizileri. Bununla birlikte, homolojinin tanımlanması , çoklu dizi hizalamasının doğal zorlukları nedeniyle zor olabilir . Belirli bir boşluklu MSA için, yorumlarında değişikliklerin atadan karakterlere karşı ” mutasyonlar ” olduğu ve hangi olayların ekleme mutasyonları veya silme mutasyonları olan çeşitli köklü filogenetik ağaçlar oluşturulabilir. Örneğin, bir boşluk bölgesi ile sadece çift bir hizalama verildiğinde, bir dizinin bir ekleme mutasyonu taşıdığını veya diğerinin bir silme taşıdığını belirlemek mümkün değildir. Sorun MSA’larda hizalanmamış ve örtüşmeyen boşluklarla büyür. Uygulamada, gürültülü verilerin ağaç hesaplamasına entegre edilmesini önlemek için hesaplanan bir hizalamanın büyük bölgeleri, filogenetik ağaç yapımında indirgenebilir.

MESAFE MATRİSİ YÖNTEMLERİ  

Filogenetik analizin uzaklık-matris yöntemleri, açıkça sınıflandırılan diziler arasındaki bir “genetik mesafe” ölçüsüne dayanır ve bu nedenle girdi olarak bir MSA’ya ihtiyaç duyarlar. Mesafe genellikle uyumsuzlukların hizalanmış konumlardaki kesri olarak tanımlanır ve boşluklar yok sayılır veya uyumsuzluk olarak sayılır. [3] Mesafe yöntemleri, dizi sorgu kümesinden her dizi çifti arasındaki mesafeyi açıklayan bir all-to-all matrisi oluşturmaya çalışır. Bundan, aynı iç düğümün altına yakından ilişkili dizileri yerleştiren bir filogenetik ağaç inşa edilirve dal uzunlukları sekanslar arasında gözlenen mesafeleri yakından çoğaltan. Mesafe matrisi yöntemleri, bunları hesaplamak için kullanılan algoritmaya bağlı olarak köklü veya köksüz ağaçlar üretebilir. Progresif ve yinelemeli çoklu dizi hizalamaları için temel olarak sıklıkla kullanılırlar . Uzaklık-matris yöntemlerinin ana dezavantajı, birden fazla alt ağaçta görülen yerel yüksek varyasyon bölgeleri hakkında bilgileri etkin bir şekilde kullanamamalarıdır. [4]

UPGMA ve WPGMA  

UPGMA ( Ağırlıklı olmayan Çift Grup Aritmetik ortalama yöntemi ) ve WPGMA ( Aritmetik ortalama Ağırlıklı İkili Grup Yöntemi ) yöntemleri ağaçları köklü ve sabit oranlı varsayımını gerektiren üretmek -, o bir varsayar ultrametrik ağacını hangi kökünden mesafeler için her dal ucu eşittir. [9]

KOMŞU BİRLEŞTİRME  

Komşu birleştirme yöntemleri , bir kümeleme metriği olarak genetik mesafeyi kullanarak dizi analizine genel küme analiz  tekniklerini uygular . Basit komşu birleştirme yöntemi, köksüz ağaçlar üretir, ancak soylar arasında sabit bir evrim hızı (yani bir moleküler saat ) varsaymaz . [10]

FİTCH – MARGOLİASH YÖNTEMİ  

Fitch-Margoliash yöntemi bir ağırlıklı kullanan en küçük kareler genetik mesafeye göre kümeleme yöntemi. [11] Yakından ilişkili dizilere, uzak ilişkili diziler arasındaki mesafelerin ölçülmesinde artan yanlışlığı düzeltmek için ağaç yapım işleminde daha fazla ağırlık verilir. Algoritmaya girdi olarak kullanılan mesafeler, yakından ilişkili ve uzak ilişkili gruplar arasındaki hesaplama hesaplamalarındaki büyük yapaylıkları önlemek için normalleştirilmelidir. Bu yöntemle hesaplanan mesafeler doğrusal olmalıdır ; mesafeler için doğrusallık kriteri beklenen değerleriniki dal için dal uzunluklarının iki dal mesafesinin toplamının beklenen değerine eşit olması gerekir – biyolojik sekanslara sadece münferit bölgelerdeki sırt mutasyonları olasılığı için düzeltildiklerinde uygulanan bir özellik . Bu düzeltme, Jukes-Cantor DNA evrim modelinden türetilmiş gibi bir ikame matrisi kullanılarak yapılır . Mesafe düzeltmesi sadece uygulamada dallar arasında evrim oranları farklılık gösterdiğinde gereklidir. [4] Özellikle konsantre mesafelerde algoritmanın başka bir modifikasyonu faydalı olabilir [12]  Tarif edilen modifikasyonun, algoritmanın verimliliğini ve sağlamlığını arttırdığı gösterilmiştir.

Bu mesafelere uygulanan en küçük kareler kriteri, komşu birleştirme yöntemlerinden daha doğru ancak daha az verimlidir. Veri setindeki yakından ilişkili birçok diziden kaynaklanan mesafeler arasındaki korelasyonları düzelten ek bir iyileştirme de artan hesaplama maliyetiyle uygulanabilir. Herhangi bir düzeltme faktörü ile en iyi şekilde en küçük kareler ağaç bulma olan NP-tam , [13] , böylece sezgisel maksimum parsimoni analizinde kullanılan gibi arama yöntemleri ağaç uzayda arama uygulanır.

DIŞ GRUPLARI KULLANMA  

Diziler veya gruplar arasındaki ilişki hakkında bağımsız bilgiler, ağaç arama alanını ve köklenmemiş kökleri azaltmaya yardımcı olmak için kullanılabilir.  Uzaklık-matris yöntemlerinin standart kullanımı , sorgu kümesindeki ilgilenilen sekanslarla sadece uzak ilişkili olduğu bilinen en az bir dış grup sekansının dahil edilmesini içerir . [3] Bu kullanım bir tür deneysel kontrol olarak görülebilir . Dış grup uygun şekilde seçildiyse, çok daha geniş bir genetik mesafeye sahip olacaktır ve böylece diğer dizilerden daha uzun bir dal uzunluğu vardır ve köklü bir ağacın kökünün yakınında görünecektir. Uygun bir dış grup seçmek, ilgili sekanslarla orta derecede ilişkili bir sekansın seçilmesini gerektirir; çok yakın bir ilişki dış grubun amacını bozar ve çok uzak analize gürültü ekler. [3] Sekansların alındığı türlerin uzaktan ilişkili olduğu durumlardan kaçınmaya da dikkat edilmelidir, ancak sekanslar tarafından kodlanan gen soylar boyunca yüksek oranda korunmuştur . Yatay gen transferi , özellikle başka türlü ıraksak bakteriler arasında , dış grup kullanımını da karıştırabilir.

MAKSİMUN PARSİMONY  

Maksimum parsimony (MP), gözlemlenen sekans verilerini açıklamak için en az toplam evrimsel olay sayısını gerektiren potansiyel filogenetik ağacın tanımlanması için bir yöntemdir . Ağaçları puanlamanın bazı yolları, belirli evrimsel olay türleriyle ilişkili bir “maliyet” içerir ve ağacı en düşük toplam maliyetle bulmaya çalışır. Bu, olası her tür olayın eşit derecede olası olmadığı durumlarda, örneğin belirli nükleotitlerin veya amino asitlerin diğerlerinden daha fazla mutasyona uğradığı biliniyorsa faydalı bir yaklaşımdır.

En cimri ağacı tanımlamanın en naif yolu, sıralı her olası ağacı göz önünde bulundurarak ve en küçük puanla ağacı aramak için basit numaralandırmadır.  Bununla birlikte, bu sadece nispeten az sayıda dizi veya tür için mümkündür, çünkü en cimri ağacı tespit etme probleminin NP-sert olduğu bilinmektedir; [4] sonuç olarak, kümedeki en iyisi olmasa da, oldukça cimri bir ağacı bulmak için optimizasyon için bir dizi buluşsal arama yöntemi geliştirilmiştir. Bu tür yöntemlerin çoğu , bir ağaç yeniden düzenleme kriteri üzerinde çalışan en dik iniş tarzı bir minimizasyon mekanizmasını içerir.

ŞUBE VE SINIR 

Dal ve sınır algoritması optimuma yakın çözümleri için aramaların etkinliğini arttırmak için kullanılan genel bir yöntem NP-zor ilk 1980’lerin başında Soyoluşun uygulanan sorunlar. [14] Dal ve bağ, filogenetik ağaç yapımına özellikle uygundur, çünkü doğal olarak bir problemin bir ağaç yapısına  bölünmesini gerektirirçünkü sorunlu alanı daha küçük bölgelere ayırır. Adından da anlaşılacağı gibi, hem dallanma kuralı (filogenetik durumunda, bir sonraki türün veya dizinin ağaca eklenmesi) hem de bir bağın (arama alanının belirli bölgelerini dikkate alınmayan bir kural) girdi olarak gerektirir. optimal çözümün o bölgeyi işgal edemeyeceğini varsayarsak).  İyi bir sınır tanımlamak, algoritmanın filogenetik uygulamasının en zor yanıdır. Sınırı tanımlamanın basit bir yolu, ağaç başına izin verilen maksimum sayıda evrimsel değişikliktir. Zharkh’ın kuralları olarak bilinen bir dizi kriter [15]tüm aday “en cimri” ağaçların paylaştığı özellikleri tanımlayarak arama alanını ciddi şekilde sınırlar. En temel iki kural, bir yedekli dizinin (hepsi birden fazla gözlemin aynı verileri ürettiği durumlar için) ve hepsinin ortadan kaldırılmasını ve en az iki türde iki veya daha fazla durumun meydana gelmediği karakter alanlarının ortadan kaldırılmasını gerektirir. İdeal koşullar altında bu kurallar ve bunlarla ilişkili algoritma bir ağacı tamamen tanımlar.

SANKOFF -MOREK-CEDERGREN ALGORİTMASI  

Sankoff-Morel-Cedergren algoritması, aynı anda bir MSA ve nükleotid dizileri için bir filogenetik ağaç üretmek için yayınlanan ilk yöntemler arasındaydı. [16] Yöntem, boşlukları ve uyumsuzlukları cezalandıran bir puanlama fonksiyonu ile birlikte maksimum bir parsimony hesaplaması kullanır , böylece minimum sayıda olay getiren ağacı tercih eder (alternatif bir görünüm, tercih edilecek ağaçların homoloji olarak yorumlanabilecek sekans benzerliği miktarı, farklı optimal ağaçlara yol açabilecek bir bakış açısı [17] ). İç düğümlerdeki çarpık diziler ağacın her biri olası her ağaçtaki tüm düğümler üzerinde puanlanır ve toplanır. En düşük puan alan ağaç toplamı, puanlama işlevi göz önüne alındığında hem en uygun ağacı hem de en uygun MSA’yı sağlar. Yöntem oldukça hesaplama açısından yoğun olduğu için, iç düzenlemeler için başlangıç ​​tahminlerinin her seferinde bir düğümde rafine edildiği yaklaşık bir yöntemdir. Hem tam hem de yaklaşık sürüm pratikte dinamik programlama ile hesaplanır. [4]

MALIGN ve POY  

Daha yeni filogenetik ağaç / MSA yöntemleri, yüksek skorlu, ancak mutlaka optimal olmayan ağaçları izole etmek için buluşsal yöntemler kullanır.  MALIGN yöntemi, bir klodogram skorunu en üst düzeye çıkararak çoklu bir hizalama hesaplamak için maksimum-parsimony tekniği kullanır ve arkadaşı POY, filogenetik ağacın optimizasyonunu karşılık gelen MSA’daki iyileştirmelerle birleştiren yinelemeli bir yöntem kullanır. [18] taraflı Ancak, evrimsel hipotez kurma bu yöntemlerin kullanımı, minimum bir evrimsel durumları yansıtan ağaç kasıtlı inşaat eleştirilmiştir. [19]Buna karşılık, bu tür yöntemlerin homoloji olarak yorumlanabilecek sekans benzerlik miktarını en üst düzeye çıkaran ağaçları bulmak için sezgisel yaklaşımlar olarak görülmesi gerektiği düşünülmektedir. [17] [20]

MAKSİMUN OLASILIK 

En yüksek olabilirlik yöntemi çıkarım için standart istatistiksel teknikler kullanan olasılık dağılımını, özellikle olası filogenetik ağaçlar atama olasılıklara.  Yöntem, belirli mutasyonların olasılığını değerlendirmek için bir ikame modeli gerektirir; kabaca, gözlemlenen filogeni açıklamak için iç düğümlerde daha fazla mutasyon gerektiren bir ağaç daha düşük bir olasılığa sahip olarak değerlendirilecektir. Bu, maksimum-parazit yöntemine büyük ölçüde benzer, ancak maksimum olasılık, hem soylar hem de sahalar arasında değişen evrim oranlarına izin vererek ek istatistiksel esnekliğe izin verir. Aslında yöntem, farklı alanlarda ve farklı soylar boyunca evriministatistiksel olarak bağımsız. Dolayısıyla azami olasılık, uzak ilişkili dizilerin analizi için çok uygundur, ancak NP-sertliği nedeniyle hesaplamaya hesaplamaya zorlanamayacağına inanılmaktadır. [21]

Dinamik programlamanın bir çeşidi olan “budama” algoritması, genellikle alt ağaçların olasılığını etkili bir şekilde hesaplayarak arama alanını azaltmak için kullanılır. [4] Metod, her bir alan için, sadece soyları yaprak olan bir düğümden (yani ağacın uçları) başlayıp iç içe kümelerde “alt” düğüme doğru geriye doğru çalışma olasılığını “doğrusal” bir şekilde hesaplar. Bununla birlikte, yöntem ile üretilen ağaçlar sadece ikame modeli geri dönüşümsüz ise köklüdür, ki bu genellikle biyolojik sistemler için geçerli değildir. Maksimum olabilirlik ağacı için arama ayrıca algoritmik olarak geliştirilmesi zor olan bir dal uzunluğu optimizasyon bileşeni içerir; Newton-Raphson gibi genel küresel optimizasyon araçları yöntemi sıklıkla kullanılır.

Filogenetik ağaçları varyant allelik frekans verilerinden (VAF’ler) çıkarmak için maksimum olasılığı kullanan bazı araçlar arasında AncesTree ve CITUP yer alır. [22] [23]

BAYES ÇIKARSAMA  

Bayes çıkarsama , filogenetik ağaçları maksimum olasılık yöntemleri ile yakından ilişkili bir şekilde üretmek için kullanılabilir. Bayes yöntemler önceden kabul olasılık dağılımını sadece verilerden oluşturulan tüm olası ağaçları arasında herhangi bir ağaç olasılığını olabilecek olası ağaçlar, veya varsayımı türetilen daha sofistike bir tahmin olabilir diverjans bağlama olayları, olarak türleşmenin olarak ortaya stokastik süreçler . Önceki dağıtımın seçimi Bayesci çıkarım filogenetik yöntemlerinin kullanıcıları arasında bir tartışma konusudur. [4]

Bayesian yöntemlerinin uygulamaları genellikle Markov zinciri Monte Carlo örnekleme algoritmalarını kullanır, ancak hareket seti seçimi değişir; Bayesci filogenetikte kullanılan seçimler arasında, her bir adımda [24] önerilen bir ağacın dairesel olarak izin veren yaprak düğümleri ve ilgili iki ağaç arasında  rastgele bir iç düğümün soyundan gelen alt ağaçlarının değiştirilmesi yer alır.  [25] Filogenetikte Bayesian yöntemlerinin kullanımı, büyük ölçüde hareket seti seçimi, kabul kriteri ve yayınlanmış eserdeki önceki dağılımın eksik spesifikasyonu nedeniyle tartışmalıdır. [4] Bayes usulleri genellikle cimrilik esaslı yöntemlerden üstün tutulur;  maksimum dallanma tekniklerinden daha uzun dal çekimine daha eğilimli olabilirler,[26] eksik veriyi daha iyi barındırabilmelerine rağmen. [27]

Olasılık yöntemleri verinin olasılığını en üst düzeye çıkaran ağacı bulurken, Bayesci bir yaklaşım, posterior dağılımdan yararlanarak en olası pençeleri temsil eden bir ağacı kurtarır. Bununla birlikte, klapelerin posterior olasılığına ilişkin tahminler (‘desteklerini’ ölçmek) özellikle ezici bir olasılıkla muhtemel olmayan klavyelerde işaretin oldukça geniş olabilir. Bu haliyle, posterior olasılığı tahmin etmek için başka yöntemler öne sürülmüştür. [28]

Varyant alelik frekans verilerinden (VAF’ler) filogenetik ağaçları çıkarmak için Bayesian çıkarımını kullanan bazı araçlar arasında Canopy, EXACT ve PhyloWGS bulunur. [29] [30] [31]

MODEL SEÇİMİ 

Moleküler filogenetik yöntemler , incelenen gen veya amino asit sekansları boyunca çeşitli bölgelerdeki nispi mutasyon oranları hakkında bir hipotezi kodlayan tanımlı bir ikame modeline dayanır . En basit haliyle, ikame modelleri , nükleotid dizilerindeki  geçiş ve enine dönüşüm oranlarındaki farklılıkları düzeltmeyi amaçlamaktadır . İkame modellerinin kullanılması, iki sekans arasındaki genetik mesafenin , iki sekansın birbirinden ayrılmasından kısa bir süre sonra doğrusal olarak artmasıyla zorunludur (alternatif olarak, mesafe birleşmeden kısa bir süre önce doğrusaldır)). Diverjanstan sonra geçen süre ne kadar uzun olursa, aynı nükleotit bölgesinde iki mutasyonun meydana gelme olasılığı artar. Basit genetik mesafe hesaplamaları böylece evrim tarihinde meydana gelen mutasyon olaylarının sayısını azımsanacaktır. Bu eksik sayının kapsamı, uzun dal çekiciliği fenomenine veya uzak ilişkili olan ancak yakınsak olarak gelişen iki sekansın yakından ilişkili olduğu şekilde yanlış tahsis edilmesine yol açabilecek ayrışmadan bu yana artan zamanla artar. [32] maksimum parsimoni usul, farklı evrim etkinlikleri az sayısını temsil eden bir ağaç için açık arama bu soruna özellikle açıktır. [4]

İKAME MODELİ

Tüm ikame modelleri, dizide temsil edilen her olası durum değişikliğine bir dizi ağırlık atar. En yaygın model tipleri dolaylı olarak tersine çevrilebilir, çünkü bunlar örneğin bir C> G mutasyonuyla aynı G> C nükleotid mutasyonuna atarlar. Mümkün olan en basit model olan Jukes-Cantor modeli , belirli bir nükleotit bazı için olası her durum değişikliğine eşit bir olasılık atar. Herhangi iki farklı nükleotid arasındaki değişim oranı, genel ikame oranının üçte biri olacaktır. [4] Daha gelişmiş modeller geçişler ve enine dönüşümler arasında ayrım yapar. GTR modeli olarak adlandırılan, mümkün olan en genel zaman geri dönüşlü model altı mutasyon oranı parametresine sahiptir. Genel 12 parametreli model olarak bilinen daha genelleştirilmiş bir model, çoklu soylar arasında tutarlı olan genetik mesafelerin hesaplanmasında çok daha fazla karmaşıklık pahasına zaman tersinirliğini bozar. [4] Bu temadaki olası bir varyasyon, oranları, DNA çift sarmal stabilitesinin önemli bir ölçütü olan genel GC içeriğinin zaman içinde değişeceği şekilde ayarlar. [33]

Modeller ayrıca, giriş dizisindeki konumlarla oranların değişmesine izin verebilir. Bu varyasyonun en belirgin örneği, protein kodlayan genlerdeki nükleotitlerin üç baz kodonlara düzenlenmesinden kaynaklanmaktadır . Konumu ise açık okuma çerçevesinin  (ORF) bilinmektedir Bu, bu mutasyonun oranları bu, bir kodon içinde belirli bir sitenin pozisyonu için ayarlanabilir oynak baz eşleştirme a’nın üçüncü nükleotid olarak yüksek mutasyon oranları için izin verebilir genetik koddaki kodonun anlamını etkilemeden kodon verildi. [32] ORF tanımlamasına dayanmayan daha az hipotez güdümlü bir örnek, her bir bölgeye önceden belirlenmiş bir dağılımdan rastgele çizilmiş bir oran, genelliklegama dağılımı veya log-normal dağılım. [4] Son olarak,  kovaryon yöntemi olarak bilinen oran varyasyonlarının daha konservatif bir tahmini, oranlarda otokorelasyonlu varyasyonlara izin verir , böylece belirli bir sitenin mutasyon oranı, sahalar ve soylar arasında korelasyon gösterir. [34]

EN İYİ MODELİ SEÇME 

Uygun bir modelin seçimi, iyi parametrelenmemiş veya aşırı kısıtlayıcı modeller, altta yatan varsayımları ihlal edildiğinde anormal davranış üretebileceğinden ve aşırı karmaşık veya aşırı parametreli modeller hesaplama açısından pahalı olduğundan ve parametreler aşırı pahalı olabileceğinden, iyi filogenetik analizlerin üretimi için kritiktir. . [32] Model seçiminin en yaygın yöntemi , model ve girdi verileri arasında ” uyum iyiliği ” ölçüsü olarak yorumlanabilecek bir olasılık tahmini üreten olabilirlik oranı testidir  (LRT).  [32] Bununla birlikte, bu sonuçları kullanırken dikkatli olunmalıdır, çünkü daha fazla parametreye sahip daha karmaşık bir model, aynı modelin basitleştirilmiş bir versiyonundan her zaman daha yüksek bir olasılığa sahip olacaktır ve bu da aşırı karmaşık olan naif model seçimine yol açabilir. [4] Bu nedenle model seçimi bilgisayar programları, daha karmaşık ikame modellerinden çok daha kötü olmayan en basit modeli seçecektir. LRT’nin önemli bir dezavantajı, modeller arasında bir dizi ikili karşılaştırma yapılması gerekliliğidir; modellerin karşılaştırılma sırasının, sonunda seçilen model üzerinde önemli bir etkisi olduğu gösterilmiştir. [35]

Alternatif bir model seçim yöntemi, gerçek model ile test edilen model arasındaki Kullback-Leibler ıraksamasının resmi bir tahmini olan Akaike bilgi kriteri (AIC) ‘dir . Aşırı parametreli modelleri cezalandırmak için bir düzeltme faktörü ile bir olasılık tahmini olarak yorumlanabilir. [32] AIC, bir çift yerine bireysel bir model üzerinde hesaplandığından, modellerin değerlendirilme sırasından bağımsızdır. İlgili bir alternatif olan Bayesci bilgi kriteri (BIC) de benzer bir temel yoruma sahiptir, ancak karmaşık modelleri daha ağır cezalandırır. [32]

DNA / Amino Asit bitişik dizi montajı, çoklu dizi hizalama, model testi (en uygun ikame modellerini test etme) ve Maksimum Olabilirlik ve Bayes Çıkarımını kullanarak filogeni rekonstrüksiyon dahil olmak üzere filogenetik ağacın oluşturulmasına ilişkin kapsamlı bir adım adım protokol mevcuttur. (Doğa Protokolü) [36]

Filogenetik ağacı değerlendirmenin geleneksel olmayan bir yolu, onu kümeleme sonucu ile karşılaştırmaktır. Üç boyutlu diziler için kümeleme sonucunu görselleştirmek ve sonra filogenetik ağacı kümeleme sonucuyla eşleştirmek için boyutsal küçültme yapmak için Interpolative Joining (Çok Boyutlu Ölçeklendirme) adı verilen Çok Boyutlu Ölçekleme tekniği kullanılabilir. Daha iyi bir ağaç genellikle kümeleme sonucu ile daha yüksek bir korelasyona sahiptir. [37]

AĞAÇ DESTEĞİNİ DEĞERLENDİRME  

Tüm istatistiksel analizlerde olduğu gibi, karakter verilerinden filogenilerin tahmini bir güven değerlendirmesi gerektirir. Filogenetik bir ağaç için destek miktarını test etmek için, filogenideki (alt düğüm desteği) her alt ağaç için desteği değerlendirerek veya filogenin diğer olası ağaçlardan önemli ölçüde farklı olup olmadığını değerlendirerek (alternatif ağaç hipotez testleri) bir dizi yöntem vardır. 

DÜĞÜM DESTEĞİ

Ağaç desteğini değerlendirmenin en yaygın yöntemi, ağaçtaki her düğüm için istatistiksel desteği değerlendirmektir. Tipik olarak, çok düşük destekli bir düğüm daha sonraki analizlerde geçerli kabul edilmez ve görsel olarak bir klaket içindeki ilişkilerin çözülmediğini göstermek için bir politomiye daraltılabilir.

UZLAŞMA AĞACI

Düğüm desteğini değerlendirmek için birçok yöntem, birden fazla filogeni dikkate almayı içerir. Fikir birliği ağacı, bir dizi ağaç arasında paylaşılan düğümleri özetler. [38] * katı bir fikir birliğinde, * sadece her ağaçta bulunan düğümler gösterilir ve geri kalanı çözülmemiş bir politomiye daraltılır . * Çoğunluk kuralı konsensüs * ağacı gibi daha az konservatif yöntemler, söz konusu ağaçların belirli bir yüzdesi (en az% 50 gibi) tarafından desteklenen düğümleri göz önünde bulundurur.

Örneğin, maksimum parsimony analizinde, aynı parsimony skoruna sahip birçok ağaç olabilir. Sıkı bir konsensüs ağacı, eşit derecede cimri ağaçlarda hangi düğümlerin bulunduğunu ve hangi düğümlerin farklı olduğunu gösterecektir. Konsensüs ağaçları, Bayes çıkarımıyla yeniden yapılandırılmış filogeniler üzerindeki desteği değerlendirmek için de kullanılır (aşağıya bakınız).

Bootstrapping ve jackknifing  

İstatistiklerde, önyükleme , orijinal verilerin yalancı bildirimlerini kullanarak bilinmeyen bir dağılımı olan verilerin değişkenliğini ortaya çıkarmak için bir yöntemdir. Örneğin, 100 veri noktası kümesi verildiğinde, bir sahte kopya , orijinal verilerden rastgele değiştirilen aynı boyutta (100 nokta) bir veri kümesidir. Yani, her orijinal veri noktası yalancı kopyada bir kereden fazla temsil edilebilir veya hiç gösterilmeyebilir. İstatistiksel destek, orijinal verinin büyük bir psödoreplikat setine benzer özelliklere sahip olup olmadığının değerlendirilmesini içerir.

Filogenetikte, önyükleme karakter matrisinin sütunları kullanılarak gerçekleştirilir. Her sahte kopya, orijinal matristen rastgele değiştirilen aynı sayıda tür (satır) ve karakter (sütun) içerir. Filogeni orijinal verilerden yeniden yapılandırmak için kullanılan aynı yöntemlerle her psödoeplikattan bir filogeni yeniden oluşturulur. Filogeni üzerindeki her bir düğüm için, düğüm desteği, o düğümü içeren psödoreplikatların yüzdesidir. [39]

Bootstrap testinin istatistiksel titizliği, bilinen evrim öykülerine sahip viral popülasyonlar kullanılarak ampirik olarak değerlendirilmiştir, [40] % 70 bootstrap desteğinin, klanın var olma olasılığının% 95 olasılığına karşılık geldiğini bulmuştur. Bununla birlikte, bu ideal koşullar altında test edilmiştir (örneğin, evrim oranlarında değişiklik, simetrik filogeni yok). Uygulamada,% 70’in üzerindeki değerler genellikle desteklenir ve güveni değerlendirmek için araştırmacıya veya okuyucuya bırakılır. % 70’in altında desteği olan düğümler tipik olarak çözülmemiş olarak kabul edilir.

Filogenetikte jackknifing benzer bir prosedürdür, ancak matrisin sütunları değiştirilmeden örneklenir. Yalancı kopyalar, verilerin rastgele alt örneklenmesiyle üretilir – örneğin, bir “% 10 jackknife”, düğüm desteğini değerlendirmek için matrisin% 10’unun rasgele örneklenmesini içerir.

POSTERİOR OLASILIK  

Filogenilerin Bayesci çıkarım kullanarak yeniden yapılandırılması, tek bir “en iyi” ağaçtan ziyade veri ve evrimsel model göz önüne alındığında oldukça muhtemel ağaçların posterior dağılımını oluşturur. Posterior dağılımdaki ağaçlar genellikle birçok farklı topolojiye sahiptir. Girdi verileri değişken alelik frekans verileri (VAF) olduğunda, EXACT aracı, tüm ağaç alanını kapsamlı bir şekilde araştırarak, ağaçların küçük, biyolojik olarak ilgili ağaç boyutları için olasılıklarını tam olarak hesaplayabilir. [29]

Çoğu Bayesci çıkarım yöntemi bir Markov zinciri Monte Carlo yinelemesini kullanır ve bu zincirin ilk adımları filogeninin güvenilir rekonstrüksiyonları olarak kabul edilmez. Zincirin erken döneminde üretilen ağaçlar genellikle yanık olarak atılır . Bir Bayesci filogenetik analizinde düğüm desteğini değerlendirmenin en yaygın yöntemi, düğümü içeren arka dağılımdaki (yanma sonrası) ağaçların yüzdesini hesaplamaktır.

Bayesci çıkarımda bir düğüm için istatistiksel desteğin, veriler ve evrimsel model göz önüne alındığında bir klonun gerçekten var olma olasılığını yansıtması beklenmektedir. [41] Bu nedenle, desteklenen bir düğüm kabul edilmesi için eşik önyükleme için daha yüksektir.

ADIM SAYMA YÖNTEMLERİ  

Bremer desteği , bir klanla çelişmek için gereken ek adımları sayar.

EKSİKLİKLER 

Bu önlemlerin her birinin kendi zayıf yönleri vardır. Örneğin, daha küçük veya daha büyük klapeler, basitçe içlerindeki takson sayısının bir sonucu olarak, orta büyüklükteki klapelerden daha büyük destek değerleri çekme eğilimindedir. [42]

Önyükleme desteği, bir klanın gerçek varlığından ziyade verilerdeki parazit nedeniyle yüksek düğüm desteği tahminleri sağlayabilir. [43]

SINIRLAMALA VE GEÇİCİ ÇÖZÜMLER  

Sonuç olarak, incelenen taksonlar arasındaki gerçek ilişkiler zaten bilinmediği sürece (laboratuvar koşullarında bakteri veya virüslerle ortaya çıkabilir) belirli bir filogenetik hipotezin doğru olup olmadığını ölçmenin bir yolu yoktur. Ampirik bir filogenetikistin elde etmeyi umabileceği en iyi sonuç, mevcut kanıtlarla iyi desteklenen dalları olan bir ağaçtır. Birkaç potansiyel tuzak tespit edilmiştir:

HOMOPLAZİ   

Bazı karakterlerin yakınsak evrimleşmesi diğerlerinden daha olasıdır ; mantıksal olarak, bu tür karakterlere bir ağacın yeniden inşasında daha az ağırlık verilmelidir. [44] Bir evrim modeli biçimindeki ağırlıklar, moleküler veri kümelerinden çıkarılabilir, böylece maksimum olasılık veya Bayes yöntemleri analiz etmek için kullanılabilir. Moleküler sekanslar için, çalışma altındaki taksonlar önemli ölçüde ayrıldığında bu problem daha da artmaktadır. İki taksonun diverjansından bu yana geçen süre boyunca, aynı bölgede birden fazla sübstitüsyon olasılığı veya geri mutasyonlar da artar, bu da hepsi homoplazilerle sonuçlanır. Morfolojik veriler için, maalesef, yakınsamayı belirlemenin tek nesnel yolu, bir ağacın inşasıdır – biraz dairesel bir yöntemdir. Yine de, homolog karakterleri ağırlıklandırmak gerçekten daha iyi desteklenen ağaçlara yol açar. [44] Daha fazla arıtma, bir yöndeki değişikliklerin diğerindeki değişikliklerden daha yüksek ağırlıklandırılmasıyla sağlanabilir; örneğin, torasik kanatların varlığı, pterygote böcekleri arasında yerleşimi neredeyse garanti eder, çünkü kanatlar sıklıkla ikincil olarak kaybolsa da, bir kereden fazla kazanıldığına dair bir kanıt yoktur. [45]

YATAY GEN TRANSFERİ  

Genel olarak organizmalar, genleri iki şekilde miras alabilir: dikey gen transferi ve yatay gen transferi . Dikey gen transferi, genlerin ebeveynlerden yavrulara geçişidir ve yatay (ayrıca lateral olarak da adlandırılır) gen transferi, genler özellikle prokaryotlarda yaygın bir fenomen olan ilişkisiz organizmalar arasında atladığında oluşur ; bunun iyi bir örneği, çoklu ilaca dirençli bakteri türlerine yol açan çeşitli bakteriler arasındaki gen değişiminin bir sonucu olarak edinilmiş antibiyotik direncidir . Ökaryotlar arasında iyi belgelenmiş yatay gen transferi vakaları da vardır .

Yatay gen transferi, organizmaların filogenilerinin belirlenmesini karmaşıklaştırmıştır ve evrim ağaçlarını oluşturmak için kullanılan genlere bağlı olarak belirli organizma grupları arasında filogenideki tutarsızlıklar bildirilmiştir. Tek yolu dikey alınana hangi genlerin belirlenmesi ve hangi yatay etmektir için parsimoniously varsayalım o dikey miras edilmiş birlikte miras olarak kalmış genlerin büyük seti; bu çok sayıda genin analiz edilmesini gerektirir.

Melezler, türleşme, introgresyonlar ve eksik soy sınıflandırması  

Kladistiklerin matematiksel modelinin altında yatan temel varsayım, türlerin çatallanma tarzında düzgün bir şekilde ayrıldığı bir durumdur. Böyle bir varsayım daha büyük ölçekte (bar yatay gen transferi, yukarıya bakınız) geçerli olsa da, türleşme genellikle çok daha az düzenlidir. Kladistik yöntemin uygulamaya konmasından bu yana yapılan araştırmalar , bir zamanlar nadir görülen melez türleşmenin , özellikle bitkilerde, oldukça yaygın olduğunu göstermiştir. [46] [47] Ayrıca parafileticik türleşme yaygındır, bifürkasyon paterni varsayımını uygun hale getirmez , ağaçlar yerine filo genetik ağlara yol açar . [48] [49] Enjeksiyon ayrıca genleri farklı türler ve hatta bazen türler arasında taşıyabilir, bu da genlere dayanan filo genetik analizi karmaşıklaştırabilir. [50] Bu fenomen “eksik soy ayrımı” na katkıda bulunabilir ve birçok grup arasında ortak bir fenomen olduğu düşünülmektedir. Tür seviyesi analizinde bu daha büyük örnekleme veya daha iyi tüm genom analizi ile ele alınabilir. [51] Çoğu zaman, analiz, yakından ilişkili olmayan örneklerle daha az sınırlandırılarak sorun önlenir.

TAKSON ÖRNEKLEMESİ 

Moleküler biyolojide gelişmiş sekanslama tekniklerinin geliştirilmesi sayesinde, filogenetik hipotezleri çıkarmak için büyük miktarlarda veri (DNA veya amino asit sekansları) toplamak mümkün hale gelmiştir. Örneğin, bütün mitokondriyal genomlara (birçok hayvanda ~ 16.000 nükleotit) dayanan karakter matrisleri ile çalışmalar bulmak nadir değildir . Bununla birlikte, simülasyonlar matristeki takson sayısını arttırmanın karakter sayısını arttırmaktan daha önemli olduğunu göstermiştir, çünkü taksiler ne kadar çok olursa, sonuçta elde edilen filogenetik ağaç o kadar doğru ve daha sağlamdır. [52] [53] Bunun nedeni kısmen uzun dalların kopması olabilir .

FİLOGENETİK SİNYAL  

Ağaç rekonstrüksiyonunun doğruluğunu etkileyen bir diğer önemli faktör, analiz edilen verilerin gerçekten yararlı bir filogenetik sinyal içerip içermediğidir, genellikle bir karakterin, rastgele değişenlerin aksine yakından ilişkili taksonlarda aynı duruma sahip olacak kadar yavaş gelişip gelişmediğini belirtmek için kullanılan bir terimdir. . Filogenetik sinyal için testler mevcuttur. [54]

SÜREKLİ KARAKTERLER  

Bir sürekliliği örnekleyen morfolojik karakterler filogenetik sinyal içerebilir, ancak ayrık karakterler olarak kodlanması zordur. Biri boşluk kodlaması olan çeşitli yöntemler kullanılmıştır ve boşluk kodlaması üzerinde farklılıklar vardır. [55] Orijinal boşluk kodlaması biçiminde: [55]

bir karakter için grup araçları önce boyuta göre sıralanır. Toplanan grup içi standart sapma hesaplanır … ve bitişik araçlar arasındaki farklar … bu standart sapmaya göre karşılaştırılır. Herhangi bir bitişik araç çifti farklı kabul edilir ve farklı tamsayı puanları verilir … eğer araçlar, grup içi standart sapmadan daha büyük bir “boşluk” ile ayrılırsa … bazı keyfi sabitler.

Analize daha fazla takson eklenirse, taksonlar arasındaki boşluklar o kadar küçük olabilir ki tüm bilgiler kaybolur. Genelleştirilmiş boşluk kodlaması, tüm taksonları içeren bir set düşünmek yerine tek tek takson çiftlerini karşılaştırarak bu soruna çözüm getirir. [55]

EKSİK VERİLER 

Genel olarak, bir ağaç oluşturulurken ne kadar çok veri elde edilirse, elde edilen ağaç o kadar doğru ve güvenilir olur. Eksik veriler, daha az veriye sahip olmaktan daha zararlı değildir, ancak eksik verilerin çoğu az sayıda taksonda olduğunda en büyük etki budur. Eksik verileri az sayıda karakter arasında yoğunlaştırmak daha sağlam bir ağaç oluşturur. [56]

FOSİLLERİN ROLÜ 

Birçok karakter embriyolojik ya da yumuşak doku ya da moleküler karakterler içerdiğinden (en iyi olarak) neredeyse hiç fosilleşmez ve fosillerin yorumlanması yaşayan taksonlardan daha belirsizdir , soyu tükenmiş taksonların neredeyse hiç olmadığı kadar eksik veri oranları canlı olanlardan daha yüksektir. Bununla birlikte, bu sınırlamalara rağmen, ağaçların seyrek alanlarında bilgi sağlayabildiği, uzun dalları kırabildiği ve ara karakter durumlarını sınırlandırabildiği için fosillerin dahil edilmesi paha biçilemez; böylece fosil taksonlar modern taksonlar kadar ağaç çözümüne de katkıda bulunur. [57] Fosil da soyların yaş sınırlamak ve böylece stratigrafık kaydı ile ne kadar uygun bir ağaç gösterebilen; [58] stratoklastikler filogenetik analizler için yaş bilgilerini veri matrislerine dahil eder.

KAYNAKÇA 

  1. Strait DS, Grine FE (Aralık 2004). “Kraniodental karakterler kullanarak hominoid ve erken hominid filogeninin çıkarılması: fosil taksonların rolü”. İnsan Evrimi Dergisi . 47 (6): 399-452. doi : 10.1016 / j.jhevol.2004.08.008 . PMID  15566946 .
  2.  Hodge T, Cope MJ (Ekim 2000). “Miyozin soy ağacı”. Hücre Bilimi Dergisi . 113 (19): 3353–4. PMID  10984423 .
  3. DM Dağı (2004). Biyoinformatik: Dizi ve Genom Analizi (2. baskı). Cold Spring Harbor, New York: Cold Spring Harbor Laboratuvarı Yayınları. ISBN 978-0-87969-712-9.
  4.  Felsenstein J (2004). Çıkarılan Filogenies . Sunderland, Massachusetts: Sinauer Associates. ISBN 978-0-87893-177-4.
  5.  Swiderski DL, Zelditch ML, Fink WL (Eylül 1998). “Morfometri neden özel değildir: filogenetik analiz için nicel verilerin kodlanması”. Sistematik Biyoloji . 47 (3): 508-19. JSTOR  2585256 . PMID  12066691 .
  6.  Gaubert P, Wozencraft WC, Cordeiro-Estrela P, Veron G (Aralık 2005). “Morfolojik filogenlerde yakınsama ve gürültü mozaikleri: viverrid benzeri bir etoburda ne var?”. Sistematik Biyoloji . 54 (6): 865-94. doi : 10.1080 / 10635150500232769 . PMID  16282167 .
  7.  Wiens JJ (2001). “Morfolojik filogenetikte karakter analizi: problemler ve çözümleri”. Sistematik Biyoloji . 50 (5): 689-99’da açıklanmaktadır. doi : 10.1080 / 106351501753328811 . PMID  12116939 .
  8.  Jenner RA (2001). “Bilatyalı filogeni ve morfolojik veri kümelerinin eleştirel olmayan geri dönüşümü”. Sistematik Biyoloji . 50 (5): 730-42. doi : 10.1080 / 106351501753328857 . PMID  12116943 .
  9.  Sokal R, Michener C (1958). Msgstr “Sistematik ilişkileri değerlendirmede istatistiksel bir yöntem”. Kansas Üniversitesi Bilim Bülteni . 38 : 1409-1438.
  10.  Saitou N, Nei M (Temmuz 1987). “Komşu birleştirme yöntemi: filogenetik ağaçların yeniden yapılandırılması için yeni bir yöntem”. Moleküler Biyoloji ve Evrim . 4 (4): 406-25. doi : 10.1093 / oxfordjournals.molbev.a040454 . PMID  3447015 .
  11.  Fitch WM , Margoliash E (Ocak 1967). “Filogenetik ağaçların inşası”. Bilim . 155 (3760): 279-84. Ürün kodu : 1967Sci … 155..279F . doi : 10.1126 / science.155.3760.279 . PMID  5334057 .
  12.  Lespinats S, Grando D, Maréchal E, Hakimi MA, Tenaillon O, Bastien O (2011). “Fitch-Margoliash Algoritması Çok Boyutlu Ölçeklemeden Nasıl Yararlanabilir” . Evrimsel Biyoinformatik Çevrimiçi . 7 : 61-85. doi : 10.4137 / EBO.S7048 . PMC  3118699 . PMID  21697992 .
  13.  WH Günü (1987). “Farklılık matrislerinden filogeni çıkarmanın hesaplama karmaşıklığı”. Matematiksel Biyoloji Bülteni . 49 (4): 461-7. doi : 10.1016 / s0092-8240 (87) 80007-1 . PMID  3664032 .
  14.  Hendy MD, Penny D (1982). “Minimum evrim ağaçlarını saptamak için dal ve sınır algoritmaları”. Matematiksel Biyobilimler . 59 (2): 277-290. doi : 10.1016 / 0025-5564 (82) 90027-X .
  15.  Ratner VA, Zharkikh AA, Kolchanov N, Rodin S, Solovyov S, Antonov AS (1995). Moleküler Evrim . Biyomatematik Serisi. 24 . New York: Springer-Verlag. ISBN 978-3-662-12530-4.
  16.  Sankoff D, Morel C, Cedergren RJ (Ekim 1973). “5S RNA’nın gelişimi ve baz replasmanının rastgele olmaması”. Doğa . 245 (147): 232-4. doi : 10.1038 / newbio245232a0 . PMID  4201431 .
  17.  De Laet J (2005). Msgstr “Sekans verisi ve sıra verilerindeki uygulanamaz sorunlar.” Albert VA’da (ed.). Parsimony, filogeni ve genomik . Oxford Üniversitesi Yayınları. s. 81–116. ISBN 978-0-19-856493-5.
  18.  Wheeler WC, Gladstein DS (1994). “MALIGN: bir çoklu nükleik asit sekansı hizalama programı”. Kalıtım Dergisi . 85 (5): 417-418. doi : 10.1093 / oxfordjournals.jhered.a111492.
  19.  Simmons MP (Haziran 2004). Msgstr “Hizalama ve ağaç aramanın bağımsızlığı”. Moleküler Filogenetik ve Evrim . 31 (3): 874-9. doi : 10.1016 / j.ympev.2003.10.008 . PMID  15120385 .
  20.  De Laet J (2015). “Hizalanmamış dizi verilerinin parsimony analizi: homolojinin en üst düzeye çıkarılması ve homoplazinin en aza indirilmesi, operasyonel olarak tanımlanmış toplam maliyetin en aza indirilmesi veya eşit ağırlıklı dönüşümlerin en aza indirilmesi değil”. Kladistikler . 31 (5): 550-567. doi : 10.1111 / cla.12098 .
  21.  Chor B, Tuller T (Haziran 2005). Msgstr “Evrim ağaçlarının maksimum olasılığı: sertlik ve yaklaşım”. Biyoinformatik (Oxford, İngiltere) . 21 Özel Sayı 1: i97-106. doi : 10.1093 / biyoinformatik / bti1027 . PMID  15961504 .
  22.  El-Kebir M, Oesper L, Acheson-Field H, Raphael BJ (Haziran 2015). “Çok örnek dizileme verilerinden klonal ağaçların ve tümör kompozisyonunun yeniden yapılandırılması” . Biyoinformatik . 31 (12): i62-70. doi : 10.1093 / biyoinformatik / btv261 . PMC  4542783. PMID  26072510 .
  23.  Malikic S, McPherson AW, Dönmez N, Sahinalp CS (Mayıs 2015). “Filogeni kullanan çoklu tümör örneklerinde klonalite çıkarımı”. Biyoinformatik . 31 (9): 1349-56’da açıklanmaktadır. doi : 10.1093 / biyoinformatik / btv003 . PMID  25568283 .
  24.  Mau B, Newton MA (1997). “Markov zinciri Monte Carlo kullanarak dendrogramlardaki ikili veriler için filogenetik çıkarım”. Hesaplamalı ve Grafik İstatistik Dergisi . 6 (1): 122-131. doi : 10.2307 / 1390728 . JSTOR  1390728 .
  25.  Yang Z, Rannala B (Temmuz 1997). “DNA dizileri kullanılarak bayesci filogenetik çıkarım: Bir Markov Zinciri Monte Carlo Yöntemi”. Moleküler Biyoloji ve Evrim . 14 (7): 717-24’te açıklanmaktadır. doi : 10.1093 / oxfordjournals.molbev.a025811 . PMID  9214744 .
  26.  Kolaczkowski B, Thornton JW (Aralık 2009). Delport W (ed.). “Bayesian filogenetiğinde uzun dal çekim cazibesi ve tutarsızlığı” . PLOS One . 4 (12): e7891. Bibcode : 2009 PLOSO … 4.7891K . doi : 10.1371 / günlük.pone.0007891 . PMC  2785476 . PMID  20011052 .
  27.  Simmons, MP (2012). “Eksik verinin varlığında olabilirlik tabanlı filogenetik analizlerin yanıltıcı sonuçları”. Kladistikler . 28 (2): 208-222. doi : 10.1111 / j.1096-0031.2011.00375.x.
  28.  Larget B (Temmuz 2013). “Koşullu klade olasılık dağılımları kullanılarak ağaç posterior olasılıklarının kestirimi” . Sistematik Biyoloji . 62 (4): 501–11. doi : 10.1093 / sysbio / syt014 . PMC  3676676 . PMID  23479066 .
  29. Ray S, Jia B, Safavi S, van Opijnen T, Isberg R, Rosch J, Bento J (22 Ağustos 2019). “Mükemmel filogeni modeli altında kesin çıkarım”. arXiv : 1908.08623v1 . Önlükkodu : 2019arXiv190808623R .
  30.  Jiang Y, Qiu Y, Minn AJ, Zhang NR (Eylül 2016). “İntratümör heterojenliğinin değerlendirilmesi ve yeni nesil dizileme ile boyuna ve uzamsal klonal evrim tarihinin izlenmesi” . Amerika Birleşik Devletleri Ulusal Bilimler Akademisi bildirileri . 113 (37): E5528-37. doi : 10.1073 / pnas.1522203113 . PMC  5027458 . PMID  27573852 .
  31.  Deshwar AG, Vembu S, Yung CK, Jang GH, Stein L, Morris Q (Şubat 2015). “FiloWGS: tümörlerin tüm genom dizilemesinden subklonal kompozisyon ve evrimin yeniden yapılandırılması” . Genom Biyolojisi . 16 (1): 35. doi : 10.1186 / s13059-015-0602-8 . PMC  4359439 . PMID  25786235 .
  32. Sullivan J, Joyce P (2005). “Filogenetikte Model Seçimi” . Ekoloji, Evrim ve Sistematiğin Yıllık İncelemesi . 36 (1): 445-466. doi : 10.1146 / annurev.ecolsys.36.102003.152633 . PMC  3144157 . PMID  20671039 .
  33.  Galtier N, Gouy M (Temmuz 1998). “Çıkarım modeli ve süreci: filogenetik analiz için homojen olmayan DNA dizisi evrim modelinin maksimum olabilirlik uygulaması”. Moleküler Biyoloji ve Evrim . 15 (7): 871–9. doi : 10.1093 / oxfordjournals.molbev.a025991 . PMID  9656487 .
  34.  Fitch WM, Markowitz E (Ekim 1970). “Bir gendeki kodon değişkenliğini belirlemek için geliştirilmiş bir yöntem ve mutasyonların evrimdeki fiksasyon hızına uygulanması”. Biyokimyasal Genetik . 4 (5): 579-93. doi : 10.1007 / bf00486096 . PMID  5489762 .
  35.  Pol D (Aralık 2004). Msgstr “Model seçimi için hiyerarşik olabilirlik oranı testinin ampirik problemleri”. Sistematik Biyoloji . 53 (6): 949-62. doi : 10.1080 / 10635150490888868 . PMID  15764562 .
  36.  Bast F (2013). “Dizi benzerlik araması, Çoklu Dizi Hizalama, Model Seçimi, Mesafe Matrisi ve Filogeni Rekonstrüksiyonu”. Protokol Değişimi . doi : 10.1038 / protex.2013.065 .
  37.  Ruan Y, House GL, Ekanayake S, Schütte U, Bever JD, Tang H, Fox G (26 Mayıs 2014). “Filogenetik ağaçların 3 boyutta görüntülenen küresel filogramlar olarak belirlenmesi için kümelenme ve çok boyutlu ölçeklemenin entegrasyonu”. 2014 14. IEEE / ACM Uluslararası Küme, Bulut ve Şebeke Bilişim Sempozyumu . IEEE. s. 720-729. doi : 10.1109 / CCGrid.2014.126 . ISBN 978-1-4799-2784-5.
  38.  Baum DA, Smith SD (2013). Ağaç Düşüncesi: Filogenetik Biyolojiye Giriş . Roberts. s. 442. ISBN 978-1-936221-16-5.
  39.  Felsenstein J (Temmuz 1985). “Filogenilere Güven Sınırları: Bootstrap Kullanarak Bir Yaklaşım”. Evrim; Uluslararası Organik Evrim Dergisi . 39 (4): 783–791. doi : 10.2307 / 2408678 . JSTOR  2408678 . PMID  28561359 .
  40.  Hillis DM, Bull JJ (1993). “Filogenetik Analizlerde Güveni Değerlendirmenin Bir Yöntemi Olarak Ampirik Önyükleme Testi”. Sistematik Biyoloji . 42 (2): 182–192. doi : 10.1093 / sysbio / 42.2.182 . ISSN  1063-5157 .
  41.  Huelsenbeck J, Rannala B (Aralık 2004). “Basit ve karmaşık ikame modelleri altında filogenetik ağaçların Bayesci posterior olasılıklarının sık özellikleri”. Sistematik Biyoloji . 53(6): 904-13. doi : 10.1080 / 10635150490522629 . PMID  15764559 .
  42.  Chemisquy MA, Prevosti FJ (2013). “Şube desteği alternatif önlemlerinde klape boyutu etkisinin değerlendirilmesi”. Zoolojik Sistematik ve Evrim Araştırmaları Dergisi : n / a. doi : 10.1111 / jzs.12024 .
  43.  Phillips MJ, Delsuc F, Penny D (Temmuz 2004). “Genom ölçeğinde filogeni ve sistematik yanlılıkların saptanması” (PDF) . Moleküler Biyoloji ve Evrim . 21 (7): 1455-8. doi : 10.1093 / molbev / msh137 . PMID  15084674 .
  44. Goloboff PA, Carpenter JM, Arias JS, Esquivel DR (2008). “Homoplaziye karşı ağırlıklandırma morfolojik veri kümelerinin filogenetik analizini geliştirir”. Kladistikler . 24 (5): 758-773. doi : 10.1111 / j.1096-0031.2008.00209.x . hdl : 11336/82003 .
  45.  Goloboff PA (1997). “Kendinden Ağırlıklı Optimizasyon: Zımni Dönüşüm Maliyetleri Altında Ağaç Aramaları ve Karakter Durumu Rekonstrüksiyonları”. Kladistikler . 13 (3): 225-245. doi: 10.1111 / j.1096-0031.1997.tb00317.x .
  46.  Arnold ML (1996). Doğal Melezleşme ve Evrim . New York: Oxford Üniversitesi Yayınları. s. 232. ISBN 978-0-19-509975-1.
  47.  Wendel JF, Doyle JJ (1998). “DNA dizilimi”. Soltis DE, Soltis PS , Doyle JJ (ed.). Bitkilerin Moleküler Sistematiği II . Boston: Kluwer. s. 265-296. ISBN 978-0-19-535668-7.
  48.  Funk DJ, Omland KE (2003). “Tür seviyesi parafili ve polifili: Hayvan mitokondriyal DNA’sından içgörüleri ile sıklık, nedenler ve sonuçlar”. Ekoloji, Evrim ve Sistematiğin Yıllık İncelemesi . 34 : 397-423. doi : 10.1146 / annurev.ecolsys.34.011802.132421 .
  49.  “Yaşam Soyağacı (GoLife)” . Ulusal Bilim Vakfı . Erişim tarihi: 5 Mayıs 2015 . GoLife programı, tüm tarih boyunca çeşitlendirme modellerinin karmaşıklığına uyum sağlayarak AToL programını temel alır. Hibridizasyon, endosimyoz ve lateral gen transferi gibi mevcut bilgi birikimimiz, Dünya üzerindeki yaşamın evrimsel tarihinin tek bir tipolojik, çatallanma yapan ağaç olarak doğru bir şekilde tasvir edilemeyeceğini açıkça ortaya koymaktadır.
  50.  Qu Y, Zhang R, Quan Q, Song G, Li SH, Lei F (Aralık 2012). “Eksik soy sıralaması veya ikincil katkı: Vinous boğazlı papağandaki (Paradoxornis webbianus) son gen akışından tarihsel ayrışmanın çözülmesi”. Moleküler Ekoloji . 21 (24): 6117-33. doi : 10.1111 / mec.12080 . PMID  23095021 .
  51.  Pollard DA, Iyer VN, Moses AM, Eisen MB (Ekim 2006). “Drosophila’da gen ağaçlarının tür ağacı ile yaygın uyuşmazlığı: eksik soy ayrımı için kanıt” . PLOS Genetiği . 2 (10): e173. doi : 10.1371 / journal.pgen.0020173 . PMC  1626107 . PMID  17132051 .
  52.  Zwickl DJ, Hillis DM (Ağustos 2002). “Artan takson örneklemesi filogenetik hatayı büyük ölçüde azaltır”. Sistematik Biyoloji . 51 (4): 588-98. doi : 10.1080 / 10635150290102339 . PMID  12228001 .
  53.  Wiens JJ (Şubat 2006). “Eksik veriler ve filogenetik analizlerin tasarımı”. Biyomedikal Bilişim Dergisi . 39 (1): 34-42. doi : 10.1016 / j.jbi.2005.04.001 . PMID  15922672 .
  54.  Blomberg SP, Garland T, Ives AR (Nisan 2003). “Karşılaştırmalı verilerde filogenetik sinyalin test edilmesi: davranışsal özellikler daha kararsızdır”. Evrim; Uluslararası Organik Evrim Dergisi . 57 (4): 717-45. doi : 10.1111 / j.0014-3820.2003.tb00285.x . PMID  12778543 .
  55. Archie JW (1985). Msgstr “Sayısal taksonomik analiz için değişken morfolojik özellikleri kodlama yöntemleri” . Sistematik Zooloji . 34 (3): 326-345. doi : 10.2307 / 2413151 . JSTOR  2413151 .
  56.  Prevosti FJ, Chemisquy MA (2009). “Eksik verilerin gerçek morfolojik filogeniler üzerindeki etkisi: Eksik girişlerin sayısının ve dağılımının etkisi”. Kladistikler . 26 (3): 326-339. doi : 10.1111 / j.1096-0031.2009.00289.x . hdl : 11336/69010 .
  57.  Cobbett A, Wilkinson M, Wills MA (Ekim 2007). “Morfolojinin parsimony analizlerinde fosiller yaşayan taksonlar kadar sert etkiler”. Sistematik Biyoloji . 56 (5): 753-66. doi : 10.1080 / 10635150701627296 . PMID  17886145 .
  58.  Huelsenbeck JP (1994). “Stratigrafik Kayıtların Filogeni Tahminleriyle Karşılaştırılması”. Paleobiyoloji . 20 (4): 470-483. doi : 10.1017 / s009483730001294x . JSTOR  2401230.
Reklam (#YSR)