A new version of this entry is available:
Loading...
Doctoral Thesis
2013
Extensions of genomic prediction methods and approaches for plant breeding
Extensions of genomic prediction methods and approaches for plant breeding
Abstract (English)
Marker assisted selection (MAS) was a first attempt to exploit molecular marker information for selection purposes in plant breeding. The MAS approach rested on the identification of quantitative trait loci (QTL). Because of inherent shortcomings of this approach, MAS failed as a tool for improving polygenic traits, in most instances. By shifting focus from QTL identification to prediction of genetic values, a novel approach called 'genomic selection', originally suggested for breeding of dairy cattle, presents a solution to the shortcomings of MAS. In genomic selection, a training population of phenotyped and genotyped individuals is used for building the prediction model. This model uses the whole marker information simultaneously, without a preceding QTL identification step. Genetic values of selection candidates, which are only genotyped, are then predicted based on that model. Finally, the candidates are selected according their predicted genetic values.
Because of its success, genomic selection completely revolutionized dairy cattle breeding. It is now on the verge of revolutionizing plant breeding, too. However, several features set apart plant breeding programs from dairy cattle breeding. Thus, the methodology has to be extended to cover typical scenarios in plant breeding. Providing such extensions to important aspects of plant breeding are the main objectives of this thesis.
Single-cross hybrids are the predominant type of cultivar in maize and many other crops. Prediction of hybrid performance is of tremendous importance for identification of superior hybrids. Using genomic prediction approaches for this purpose is therefore of great interest to breeders. The conventional genomic prediction models estimate a single additive effect per marker. This was not appropriate for prediction of hybrid performance because of two reasons. (1) The parental inbred lines of single-cross hybrids are usually taken from genetically very distant germplasm groups. For example, in hybrid maize breeding in Central Europe, these are the Dent and Flint heterotic groups, separated for more than 500 years. Because of the strong divergence between the heterotic groups, it seemed necessary to estimate heterotic group specific marker effects. (2) Dominance effects are an important component of hybrid performance. They had to be included into the prediction models to capture the genetic variance between hybrids maximally.
The use of different heterotic groups in hybrid breeding requires parallel breeding programs for inbred line development in each heterotic group. Increasing the training population size with lines from the opposite heterotic group was not attempted previously. Thus, a further objective of this thesis was to investigate whether an increase in the accuracy of genomic prediction can be achieved by using combined training sets.
Important traits in plant breeding are characterized by binomially distributed phenotypes. Examples are germination rate, fertility rates, haploid induction rate and spontaneous chromosome doubling rate. No genomic prediction methods for such traits were available. Therefore, another objective was to provide methodological extensions for such traits.
We found that incorporation of dominance effects for genomic prediction of maize hybrid performance led to considerable gains in prediction accuracy when the variance attributable to dominance effects was substantial compared to additive genetic variance. Estimation of marker effects specific to the Dent and Flint heterotic group was of less importance, at least not under the high marker densities available today. The main reason for this was the surprisingly high linkage phase consistency between Dent and Flint heterotic groups. Furthermore, combining individuals from different heterotic groups (Flint and Dent) into a single training population can result in considerable increases in prediction accuracy. Our extensions of the prediction methods to binomially distributed data yielded considerably higher prediction accuracies than approximate Gaussian methods.
In conclusion, the developed extensions of prediction methods (to hybrid prediction and binomially distributed data) and approaches (training populations combining heterotic groups) can lead to considerable, cost free gains in prediction accuracy. They are therefore valuable tools for exploiting the full potential of genomic selection in plant breeding.
Abstract (German)
Die markergestütze Selektion (MGS) war ein Versuch molekulare Markern für Selektionszwecke in der Pflanzenzüchtung nutzbar zu machen. Der MGS Ansatz basierte auf der Identifikation von "quantitative trait loci'' (QTL, zu deutsch: Loci mit Effekt auf ein quantitatives Merkmal). Auf Grund inhärenter Defizite schlug der Versuch, MGS für die Verbesserung poligener Merkmale zu verwenden, fehl. Mit einem neuen Ansatz, genomische Selektion genannt und für die Milchrinderzüchtung entwickelt, gelang es, die Defizite der MGS zu überwinden, indem der Schwerpunkt weg von der Identifikation von QTL und hin zur Vorhersage von genetischen Werten gelegt wurde. Für die genomische Selektion wird mit Hilfe einer Kalibrierungspopulation, bestehend aus phenotypisierten und genotypisierten Individuen, ein Vorhersagemodell erstellt. Für dieses Modell wird die Information aller molekularer Marker simultan verwendet. Mit Hilfe des Vorhersagemodells werden anschließend die genetischen Werte der Selektionskandidaten, die nur genotypisiert wurden, vorhergesagt. Aufgrund ihres Erfolges revolutionierte die genomische Selektion bereits die Milchrinderzüchtung. Pflanzenzüchtung und Milchrinder\-züchtung unterscheiden sich aber in grundlegenden Aspekten. Auf Grund dessen war es notwendig, die Methodik zu erweitern, um die genomische Selektion für die in der Pflanzenzüchtung typischen Szenarien einsetzen zu können.
Einfachkreuzungen sind der dominierende Sortentyp in Mais und vielen anderen Kulturen. Um überlegene Hybriden zu identifizieren, ist die Vorhersage der Hybridleistung von zentraler Bedeutung. Der Einsatz von genomischen Vorhersageverfahren ist daher von großem Interesse für die Pflanzenzüchtung. Die herkömlichen genomischen Vorhersagemodelle schätzen nur einen einzigen, additive Effekt pro Marker. Aus zwei Gründen war dies nicht adäquat für die Vorhersage der Hybridleistung. (1) Die Elternlinien einer Hybride entstammen üblicherweise genetisch sehr verschiedenen Genpools, auch heterotische Gruppen genannt. In der Maishybridzüchtung in Mitteleuropa, sind dies zum Beispiel der Dent- und Flintpool, die seit mindestens 500 Jahren getrennt sind. Wegen dieser ausgeprägten Divergenz schien es notwendig, spezifische Markereffekte für jede heterotische Gruppe zu schätzen. (2) Dominanzeffekte sind eine wesentliche Komponente der Hybridleistung. Sie mussten daher in die Vorhersagemodelle aufgenommen werden, um die genetische Varianz zwischen den Hybriden so vollständig wie möglich zu erfassen. Die Verwendung verschiedener heterotischer Gruppen in der Hybridzüchtung erfordert es, für die Linienentwicklung innerhalb der heterotischer Gruppen, parallele Zuchtprogramme zu unterhalten. Es wurde allerdings noch nicht versucht, die Größe der Kalibrierungspopulation mit Linien der jeweils anderen heterotischen Gruppe zu erhöhen. Ein weiteres Ziel dieser Dissertation war es deshalb, zu untersuchen, ob die Vereinigung verschiedener heterotischer Gruppen in einer Kalibrierungspopulation zu einer Erhöhung der Vorhersagegenauigkeit führen kann.
Einige für die Pflanzenzüchtung wichtige Merkmale sind dadurch gekennzeichnet, dass die phenotypischen Daten einer Binomialverteilung folgen. Beispiele dafür sind Keim-, Fruchtbarkeits- und Haploideninduktionsraten. Da für diese Art von Merkmal bisher keine Vorhersagemethodik zur Verfügung stand, sollte diese in der vorliegenden Arbeit entwickelt werden.
Unsere Ergebnisse zeigten, dass die Schätzung von Dominanzeffekten die Genauigkeit der vorhergesagten Hybridleistung deutlich erhöhen konnte, wenn die Dominanzvarianz einen wesentlichen Anteil an der gesamten genetischen Varianz darstellt. Bei hohen Markerdichten machte es kaum einen Unterschied, ob für heterotische Gruppen spezifische Markereffekte geschätzt wurden. Der Hauptgrund dafür war die überraschend hohe Übereinstimmung in den Kopplungsphasen der heterotischen Gruppen Dent und Flint. Des weiteren zeigten wir, dass die Vereinigung von Linien aus Dent und Flint in einer einzigen Kalibrierungspopulation zu einer beträchtlichen Steigerung der Vorhersagegenauigkeit führen kann. Unsere Erweiterungen der Vorhersagemethodik auf binomialverteilte Daten erzielten im Vergleich zu approximativen Methoden eine deutlich höhere Vorhersagegenauigkeit.
Insgesamt zeigen die erzielten Ergebnisse, dass die in dieser Dissertation entwickelten Erweiterungen der Vorhersagemethoden (für Vorhersage der Hybridleistung und für binomialverteilte Daten) und -ansätze (Vereinigung von heterotischen Gruppen in einer Kalibrierungspopulation), zu einer beträchtlichen, kostenfreien Erhöhung der Vorhersagegenauigkeit in der genomischen Selektion im pflanzenzüchterischen Kontext führen können. Sie stellen daher ein wertvolles Mittel dar, um das Potential der genomischen Selektion in der Pflanzenzüchtung voll auszuschöpfen.
File is subject to an embargo until
This is a correction to:
A correction to this entry is available:
This is a new version of:
Notes
Publication license
Publication series
Published in
Faculty
Faculty of Agricultural Sciences
Institute
Institute of Plant Breeding, Seed Science and Population Genetics
Examination date
2013-12-12
Supervisor
Edition / version
Citation
Identification
DOI
ISSN
ISBN
Language
English
Publisher
Publisher place
Classification (DDC)
580 Plants
Original object
Free keywords
Standardized keywords (GND)
BibTeX
@phdthesis{Technow2013,
url = {https://hohpublica.uni-hohenheim.de/handle/123456789/5780},
author = {Technow, Frank},
title = {Extensions of genomic prediction methods and approaches for plant breeding},
year = {2013},
school = {Universität Hohenheim},
}