A new version of this entry is available:

Loading...
Thumbnail Image
Doctoral Thesis
2022

Deciphering the potential of large-scale proteomics to improve product quality and nutritional value in different wheat species

Abstract (English)

Wheat (Triticum aestivum) is one of the most important staple crops globally, which provides on average ~20% of the dietary intake of protein, starch and further important ingredients like fiber, minerals, vitamins, and essential amino acids for humans. Besides common wheat, there exist further wheat species with global to only local importance, i.e., durum, spelt, emmer and einkorn. Common wheat and durum are relatively widely cultivated whereas the other three species are cultivated only in specific regions. Apart from other functions, wheat proteins largely influence the end-use quality of products such as bread and pasta quality. Furthermore, wheat proteins can induce inflammatory reactions in humans such as celiac disease, wheat allergy and non-celiac wheat sensitivity. Thus, proteome profiles of different wheat species and cultivars within these species are of high relevance for stakeholders along the wheat supply chain. Proteomic technology has made breakthrough advancements in the recent times capable of quantifying thousands of proteins in 1.5–2 hours. Also, the wheat reference genome has been published and extended recently. These developments are extremely helpful in studying the wheat proteome at a high resolution. However, the modern large-scale proteomics has yet neither been applied to perform comparative investigation of the proteomes of different wheat species nor to study the proteomes of different types of breads and flours nor to study its application in the context of plant breeding. Therefore, we utilized modern large-scale proteomics to fill these gaps within the framework of this PhD work. First of all, an optimized data analysis pipeline was designed to deal with big proteomics data. This was necessary to estimate a multitude of quantitative genetics parameters for each protein and perform a comparative investigation of the proteomes. Optimization included implementation of data filtering based on the quantification of a protein in a given proportion of the samples, cultivars and environments. Different tests such as test for normal distribution of each protein in the context of statistical modelling and test to check the equality of variance between groups to apply the appropriate t-test were incorporated into a semi-automated workflow. In parallel, we adjusted and improved the lab methodology to deal with hundreds of samples within a short time period. We introduced a novel hybrid liquid chromatography-mass spectrometry (LC-MS) approach that combines quantification concatamer (QconCAT) technology with short microflow LC gradients and data-independent acquisition (DIA). The proposed approach measures the proteome by label-free quantification (LFQ) while concurrently providing accurate QconCAT-based absolute quantification of the key amylase/trypsin inhibitors (ATIs). These methods were then applied to compare different wheat species based on dozens of cultivars grown at multiple locations. First, we compared common wheat and spelt and identified 3,050 proteins overall. Of total proteins, 1,555 proteins in spelt and 1,166 in common wheat were only detected in a subset of the field locations. There were 1,495 and 1,604 proteins in spelt and common wheat, respectively, which were consistently expressed across all test locations in at least one cultivar. Finally, there were 84 and 193 unique proteins for spelt and common wheat, respectively, as well as 396 joint proteins, which were significantly differentially expressed between the two species. Using potentially allergenic proteins – annotated as amylase/trypsin inhibitors, serpins, and wheat germ agglutinin – we calculated an equally weighted “allergen index” that largely varied across cultivars ranging from –13.32 to 10.88 indicating the potential to select for cultivars with favorable proteome profiles. Next, we examined the proteomes of six different flours (wholegrain and superfine flours) and 14 different bread types (yeast and sourdough fermented breads and common wheat breads plus/minus bread improver) from common wheat, spelt and rye. Proteins that could cause allergies were functionally classified and comparatively measured by LFQ in flours and breads. Our findings showed that allergenic proteins were more prevalent in common wheat and spelt than rye and were not specifically degraded during bread manufacturing. In terms of abundance of the allergenic proteins, there was almost no difference between spelt and common wheat and the type of grain is likely more important for allergenicity than milling or traditional fermentation techniques. In a further study, we generated the flour reference proteomes for five wheat species, identifying at least 2,540 proteins in each species. More than 50% of the proteins significantly differed between species. Particularly, einkorn expressed 5.4 and 7.2 times less allergens and amylase/trypsin inhibitors than common wheat, respectively, emerging as a potential alternative cereal crop for people with sensitivities to cereal allergens. Lastly, we studied the application of large-scale proteomics for plant breeding. We found a significant impact of the environmental factors on protein expression. Only a fraction of proteins was stably expressed in all environments in at least one cultivar. Environmental influence was observed not only in the form of absolute expression or suppression of a certain protein at one or more environments but also in the form of low heritability (H2). High coefficients of variation across wheat cultivars indicate that the protein profiles of different cultivars vary considerably. Although, heritability was low for many proteins, we were able to identify hundreds of proteins with H²>0.5 – including key proteins for baking quality and human health. It should be possible to specifically manipulate the expression of functionally important proteins with high heritability by selecting and breeding for superior wheat cultivars along the wheat supply chain. Nevertheless, a successful implementation in plant breeding programs needs an improvement in the speed of protein quantification methods and in the validation of protein functions and annotations. In a nutshell, high number of proteins can be quantified in cereal grains utilizing cutting-edge proteomics techniques, opening new avenues for their use in the wheat supply chain. We generated lists of intriguing candidate proteins for further investigations on wheat sensitivity, and proteins with high heritability and important biological functions. Current research work has significant implications for the scientific and business communities across multiple disciplines including breeding, agriculture, cereal technology, nutritional science, health, and medicine. Political decision-makers and stakeholders in the food supply chain can benefit from the findings of this PhD project.

Abstract (German)

Weizen (Triticum aestivum) ist weltweit eines der wichtigsten Grundnahrungsmittel, das im Durchschnitt etwa 20 % des täglichen Bedarfs an Eiweiß, Stärke und weiteren wichtigen Inhaltsstoffen wie Ballaststoffen, Mineralien, Vitaminen und essentiellen Aminosäuren für den Menschen liefert. Neben Weichweizen gibt es weitere Weizenarten mit globaler oder nur lokaler Bedeutung, nämlich Hartweizen, Dinkel, Emmer und Einkorn. Weichweizen und Hartweizen werden relativ weit verbreitet angebaut, während die anderen drei Arten nur in bestimmten Regionen genutzt werden. Weizenproteine haben u.a. einen großen Einfluss auf die Qualität von Produkten wie Brot und Teigwaren. Darüber hinaus können Weizenproteine beim Menschen Entzündungsreaktionen wie Zöliakie, Weizenallergie und Nicht-Zöliakie-Weizensensitivität hervorrufen. Daher sind die Proteom-Profile verschiedener Weizenarten und -sorten innerhalb dieser Arten für die Akteure entlang der Weizenwertschöpfungskette von großer Bedeutung. Die Proteomtechnologie hat in jüngster Zeit bahnbrechende Fortschritte gemacht und ist in der Lage, Tausende von Proteinen in 1,5–2 Stunden zu quantifizieren. Außerdem wurde das Weizen-Referenzgenom kürzlich veröffentlicht und erweitert. Diese Entwicklungen sind äußerst hilfreich bei der Untersuchung des Weizenproteoms mit hoher Auflösung. Diese Proteomikmethode wurde jedoch bisher weder für die vergleichende Untersuchung der Proteome verschiedener Weizenarten noch für die Untersuchung der Proteome verschiedener Brot- und Mehlsorten noch für die Untersuchung ihrer Anwendung im Rahmen der Pflanzenzüchtung eingesetzt. Daher haben wir im Rahmen dieser Doktorarbeit diese moderne Proteomikmethodik eingesetzt, um diese Lücken zu schließen. Zunächst wurde eine optimierte Datenanalyse-Pipeline entwickelt, um mit großen Proteomdatensätzen umgehen zu können. Dies war notwendig, um eine Vielzahl von quantitativen genetischen Kennzahlen für jedes Protein zu schätzen und eine vergleichende Untersuchung der Proteome durchzuführen. Die Optimierung umfasste die Implementierung einer Datenfilterung auf der Grundlage der Quantifizierung eines Proteins in einem bestimmten Anteil der Proben, Sorten und Orte. Verschiedene Tests wie der Test auf Normalverteilung jedes Proteins im Rahmen der statistischen Modellierung und der Test zur Überprüfung der Gleichheit der Varianz zwischen den Gruppen zur Anwendung des entsprechenden t-Tests wurden in einen halb-automatischen Arbeitsablauf integriert. Zudem haben wir die Labormethodik angepasst und verbessert, um Hunderte von Proben in kurzer Zeit zu verarbeiten. Wir führten einen neuartigen hybriden Flüssigchromatographie-Massenspektrometrie (LC-MS)-Ansatz ein, der die Quantifizierungs-Konkatamer-Technologie (QconCAT) mit kurzen Mikrofluss-LC-Gradienten und datenunabhängiger Erfassung (DIA) kombiniert. Der vorgeschlagene Ansatz misst das Proteom durch markierungsfreie Quantifizierung (LFQ) und liefert gleichzeitig eine genaue absolute Quantifizierung der wichtigsten Amylase/Trypsin-Inhibitoren (ATIs) auf QconCAT-Basis. Diese Methodik wurde eingesetzt, um die potenziellen Unterschiede zwischen Dinkel und Weichweizen zu untersuchen, wobei der Schwerpunkt auf Proteinen lag, die für die menschliche Gesundheit von Bedeutung sind. Wir identifizierten insgesamt 3.050 Proteine. Von den Gesamtproteinen wurden 1.555 Proteine in Dinkel und 1.166 Proteine in Weichweizen nur an einigen der Feldstandorte nachgewiesen. Es gab 1.495 bzw. 1.604 Proteine in Dinkel und Weichweizen, die an allen Feldstandorten in mindestens einer Sorte konsistent exprimiert waren. Schließlich gab es 84 bzw. 193 einzigartige Proteine für Dinkel und Weichweizen sowie 396 gemeinsame Proteine, die zwischen den beiden Arten signifikant unterschiedlich exprimiert wurden. Anhand der potenziell Allergenen Proteine – Amylase-/Trypsin-Inhibitoren, Serpine und Weizenkeim-Agglutinin – berechneten wir einen gleich gewichteten "Allergen-Index", der zwischen den einzelnen Sorten stark variierte und zwischen -13,32 und 10,88 lag, was das große Potenzial der Proteomik für zukünftige Weizenforschung aufzeigt. Als nächstes untersuchten wir die Proteome von sechs verschiedenen Mehlen (Vollkorn- und Auszugsmehle) und 14 verschiedenen Brotsorten (hefe- und sauerteigfermentierte Brote und Weichweizenbrote plus/minus Brotverbesserungsmittel) aus Weichweizen, Dinkel und Roggen. Proteine, die Allergien auslösen könnten, wurden funktionell klassifiziert und mittels LFQ in Mehlen und Broten vergleichend gemessen. Unsere Ergebnisse zeigten, dass allergene Proteine in Weichweizen und Dinkel häufiger vorkommen als in Roggen und bei der Brotherstellung nicht spezifisch abgebaut werden. In Bezug auf die Menge der allergenen Proteine gab es fast keinen Unterschied zwischen Dinkel und Weichweizen, und die Getreideart ist wahrscheinlich wichtiger für die Allergenität als das Mahlen oder die traditionellen Fermentationsverfahren. In einer weiteren Studie erstellten wir die Mehlreferenzproteome für fünf Weizenarten und identifizierten mindestens 2.540 Proteine in jeder Art. Mehr als 50 % der Proteine unterschieden sich signifikant zwischen den Arten. Vor allem Einkorn wies 5,4 bzw. 7,2 Mal weniger Allergene und Amylase-/Trypsin-Inhibitoren auf als Weichweizen, was ihn zu einer potenziellen Getreidealternative für Menschen macht, die empfindlich auf Getreideallergene reagieren. Abschließend untersuchten wir die Anwendung der neuen Proteomikmethode für die Pflanzenzucht. Wir stellten fest, dass die Umweltfaktoren einen erheblichen Einfluss auf die Proteinexpression haben. Nur ein Bruchteil der Proteine wurde in allen Teststandorten in mindestens einer Sorte stabil exprimiert. Der Umwelteinfluss zeigte sich nicht nur in Form einer absoluten Expression oder Unterdrückung eines bestimmten Proteins in einer oder mehreren Orten, sondern auch in Form einer geringen Erblichkeit (H2). Hohe Variationskoeffizienten zwischen den Weizensorten deuten darauf hin, dass die Proteinprofile der verschiedenen Sorten erheblich variieren. Obwohl die Erblichkeit bei einem Großteil der Proteine klein war, konnten wir Hunderte von Proteinen mit H²>0,5 herausarbeiten - darunter Schlüsselproteine für die Backqualität und die menschliche Gesundheit. Es sollte möglich sein, die Expression funktionell wichtiger Proteine mit hoher Erblichkeit durch Selektion und Züchtung auf überlegene Weizensorten entlang der Weizenlieferkette gezielt zu beeinflussen. Vor einer aktiven Umsetzung in der Pflanzenzüchtung ist es jedoch dringend erforderlich, die Geschwindigkeit der Proteinquantifizierungsmethoden und die Validierung der Proteinfunktionen und -annotationen zu verbessern. Zusammenfassend kann gesagt werden, dass eine große Anzahl von Proteinen in Getreidekörnern mit Hilfe modernster Proteomik-Techniken quantifiziert werden kann, was neue Wege für ihre Verwendung in der Weizenlieferkette eröffnet. Wir haben Listen mit interessanten Kandidatenproteinen für weitere Untersuchungen zur Weizensensitivität sowie mit Proteinen mit hoher Erblichkeit und wichtigen biologischen Funktionen erstellt. Diese Forschungsarbeit hat erhebliche Auswirkungen auf die Wissenschaft und die Wirtschaft in verschiedenen Disziplinen wie Züchtung, Landwirtschaft, Getreidetechnologie, Ernährungswissenschaft, Gesundheit und Medizin. Politische Entscheidungsträger und Interessengruppen in der Lebensmittelversorgungskette können von den Ergebnissen dieser Doktorarbeit profitieren.

File is subject to an embargo until

This is a correction to:

A correction to this entry is available:

This is a new version of:

Notes

Publication license

Publication series

Published in

Faculty
State Institutes
Institute
State Plant Breeding Institute

Examination date

2023-01-29

Edition / version

Citation

DOI

ISSN

ISBN

Language
English

Publisher

Publisher place

Classification (DDC)
630 Agriculture

Original object

BibTeX

@phdthesis{Afzal2022, url = {https://hohpublica.uni-hohenheim.de/handle/123456789/6851}, author = {Afzal, Muhammad}, title = {Deciphering the potential of large-scale proteomics to improve product quality and nutritional value in different wheat species}, year = {2022}, school = {Universität Hohenheim}, }