La tassonomia batterica è una disciplina fondamentale in microbiologia, in quanto fornisce un sistema di classificazione operativo e predittivo, fondamentale sia nella ricerca di base (corretta comunicazione scientifica) che nel campo applicativo (identificazione affidabile di microrganismi utilizzati nei processi industriali). Attualmente, le metodiche molecolari standard per la corretta delineazione di una specie procariotica sono l’ibridazione DNA-DNA e l’analisi della sequenza del gene codificante il 16S rRNA. Tuttavia, la recente disponibilità di sequenze genomiche consente, per la prima volta, l’indagine delle relazioni tra organismi su base genomica e l’analisi della loro storia evolutiva. Nel presente lavoro, è stato investigato il ruolo della genomica nella tassonomia ed evoluzione delle specie appartenenti al genere Lactobacillus e ai generi ad esso correlati, attraverso l'applicazione di diverse tecniche. L'interesse verso questi batteri deriva dalla presenza di specie GRAS (Generally Recognised As Safe) e per il loro importante ruolo nella produzione di alimenti fermentati. Inoltre, alcuni ceppi di origine umana sono utilizzati come probiotici o vettori vaccinali. Nella prima parte della tesi, l’aggiornamento tassonomico del genere Lactobacillus sulla base dell'analisi comparativa del gene 16S rRNA ha rivelato come esso sia caratterizzato da una complessa storia evolutiva, i cui membri sono combinati con le specie del genere Pediococcus. In aggiunta, la maggior parte delle specie del genere Lactobacillus è inclusa in 15 gruppi filogenetici supportati dal punto di vista statistico; tuttavia le specie appartenenti allo stesso gruppo non sempre condividono le stesse proprietà fenotipiche, soprattutto per quanto riguarda il metabolismo dei carboidrati, sul quale si è sempre basata l’analisi tassonomica classica dei lattobacilli. Infine, due specie, Lactobacillus catenaformis e L. vitulinus si sono rivelate correlate alle specie appartenenti al gruppo XVII del subphylum Clostridium, e quindi sono stati riclassificate rispettivamente in Eggerthia catenaformis e Kandleria vitulina. La presenza di gruppi filogenetici consistenti e la discrepanza tra i dati filogenetici e metabolici hanno costituito il substrato appropriato per l'integrazione dei dati genomici, conseguita nella seconda parte del presente studio. Il primo approccio genomico ha previsto l’analisi comparativa del background genetico relativo alle due vie metaboliche principali del metabolismo dei carboidrati, glicolisi e via dei pentoso fosfati, condotta sui genomi di 42 ceppi appartenenti ai generi dei batteri lattici dell’ordine Lactobacillales. L’indagine si è focalizzata sulla distribuzione del contenuto genico e dell’ordine dei geni sul cromosoma e ha fornito nuove informazioni riguardanti le basi genetiche del metabolismo omo/eterofermentante oltre che rivelare specifici eventi di perdita o acquisto di geni appartenenti alle due vie di interesse, in particolare per i membri del gruppo filogenetico di Lactobacillus delbrueckii, la specie tipo del genere Lactobacillus. La peculiare distribuzione di 5 geni della glicolisi (pdhA, pdhB, PdhC, pdhD e pfkA) nei ceppi sequenziati del gruppo L. delbrueckii ha motivato la validazione tassonomica di questi putativi marcatori sui ceppi tipo di tutte le specie appartenenti a questo gruppo, i quali hanno rivelato un background genotipico omogeneo (assenza di pdhA, pdhB, pdhC e pdhD e presenza del gene pfkA), nonostante la loro eterogeneità dal punto di vista metabolico. Questi dati rappresentano un passo-chiave per la risoluzione della discrepanza che caratterizza la tassonomia dei lattobacilli, in quanto è stata ritrovata una corrispondenza tra il background genotipico relativo al metabolismo degli zuccheri e i dati filogenetici. Inoltre, questi risultati hanno dimostrato come l'approccio proposto, basato sulla genomica comparativa e sull’analisi evolutiva e successiva validazione tassonomica sui ceppi di tipo, rappresenta un efficace modus operandi utile alla risoluzione delle problematiche tassonomiche e per la corretta caratterizzazione dei taxa. Nell'ultima parte dello studio, è stato dimostrato come il genoma di un singolo ceppo costituisca una risorsa fondamentale per lo sviluppo di uno schema di tipizzazione MultiLocus Sequence Typing (MLST) e quindi sia un valido supporto per lo studio dell'analisi intraspecifica di una collezione di ceppi. Un altro risultato importante di questo progetto è il contributo metodologico derivante dai dati genomici, che sono stati integrati con diverse metodiche combinate che coinvolgono filogenesi molecolare, analisi del contenuto genico e dell'ordine dei geni sul cromosoma, l’analisi a network e MLST. In conclusione, l'analisi tassonomica del genere Lactobacillus, in particolare, e dei generi ad esso correlati, ha mostrato come l'integrazione dei dati genomici costituisca un potente supporto per la descrizione tri-dimensionale dei taxa batterici, creando un collegamento tra i criteri tassonomici attuali e armonizzando i dati fenotipici, filogenetici e genotipici.

Bacterial taxonomy is a fundamental discipline in microbiology since it provides an operative and predictive classification system, and constitutes a framework for application (i.e., reliable identification of microorganisms), scientific communication and knowledge exchange. According to the prokaryotic species definition, DNA-DNA hybridization and analysis of 16S rRNA gene sequence are currently being considered the golden standard molecular criteria for prokaryotic species delineation. However, the recent availability of complete sequence of prokaryotic genomes allows, for the first time, the fulfill investigation of the genomic relatedness between organisms and gives the opportunity to reconstruct events of genome evolution and understand the natural relationships between microorganisms. In the present research project the role of genomics was investigated for the taxonomy and evolution of Lactobacillus genus and related genera in different taxonomic ranks, through the application of several techniques. The interest in these bacteria derives from the presence of the highest number of GRAS species (Generally Recognised As Safe) and for their role in fermented food production. Moreover, certain strains of human origins are being exploited as probiotics or vaccine carriers. In the first part of the dissertation, the taxonomic analysis of Lactobacillus genus based on the comparative analysis on 16S rRNA gene sequence confirmed the heterogeneity of this genus, which was intermixed with Pediococcus genus, and characterized by a complex evolutionary history. Furthermore, the majority of Lactobacillus species was found to be included in 15 robust subgeneric groups, but species belonging to the same cluster did not always share the same phenotypic properties, especially data coming from the analysis of carbohydrate metabolism, upon which traditional taxonomic analysis is based. Finally, two species, Lactobacillus catenaformis and L. vitulinus were found to be part of to Clostridium subphylum cluster XVII, therefore they were reclassified as Eggerthia catenaformis and Kandleria vitulina, respectively. The presence of consistent phylogenetic groups and the discrepancy between metabolic and phylogenetic data constituted the appropriate taxonomic framework for genome data integration, which was applied in the second part of the present study. The genetic background of the metabolic pathways related to carbohydrate metabolism, i.e. glycolysis and pentose phosphate pathway, was analysed in 42 strains belonging to Lactobacillus and related genera of order Lactobacillales: the investigation of gene order and distribution provided new information concerning the genetic bases of heterofermentative/homofermentative metabolism in lactic acid bacteria and lineage specific trends of gene loss/gain within the two metabolic pathways, in particular for Lactobacillus delbrueckii-group. The detection of peculiar glycolytic gene distribution in Lactobacillus species belonging to different metabolic groups in terms of presence/absence of five putative markers (pdhA, pdhB, pdhC, pdhD and pfkA) motivated the taxonomic validation of these data on the type strains of species belonging to L. delbrueckii-group, as the first step towards a genome-based taxonomy of Lactobacillus. A coherent genetic background (absence of pdhA, pdhB, pdhC, pdhD, and presence of pfkA) was detected for species of L. delbrueckii-group despite their metabolic heterogeneity. These data represent a key-step for the resolution of Lactobacillus taxonomy, since a matching between the genotypic background related to carbohydrate metabolism and phylogenetic data was found for L. delbrueckii-group, denoted here as Lactobacillus sensu stricto, due to its diversity from the rest of lactobacilli, as it was revealed from comparative genomic analysis. Furthermore these results demonstrated that the proposed approach, based on comparative genomics and evolutionary analysis and then taxonomic validation on the type strains, can represent a successful modus operandi to resolve taxonomic issues and for the correct characterization of taxa. In the last part of the study, a single sequenced genome was shown to constitute a fundamental resource for the development of a Multilocus Seqeunce Typing (MLST) scheme, thus demonstrating that the availability of a single sequenced strain (even if a non type-strain) is a valuable support for the investigation of the intraspecific analysis of a panel of strains and a genome-based indication for the sequencing of other strains. Another important outcome of this project is the methodological contribution derived from genome data, which were integrated with different combinations involving molecular phylogeny, analysis of pathway gene content and order, split decomposition and MLST. In conclusion, the taxonomic analysis of Lactobacillus genus and related genera has shown that genome data integration is a powerful support for the creation of a tri-dimensional description of taxa, which creates a link between current taxonomic criteria and harmonizes genotypic, phylogenetic and phenotypic data.

Genomics in the taxonomy and evolution in Lactobacillus and related genera

SALVETTI, Elisa
2012

Abstract

La tassonomia batterica è una disciplina fondamentale in microbiologia, in quanto fornisce un sistema di classificazione operativo e predittivo, fondamentale sia nella ricerca di base (corretta comunicazione scientifica) che nel campo applicativo (identificazione affidabile di microrganismi utilizzati nei processi industriali). Attualmente, le metodiche molecolari standard per la corretta delineazione di una specie procariotica sono l’ibridazione DNA-DNA e l’analisi della sequenza del gene codificante il 16S rRNA. Tuttavia, la recente disponibilità di sequenze genomiche consente, per la prima volta, l’indagine delle relazioni tra organismi su base genomica e l’analisi della loro storia evolutiva. Nel presente lavoro, è stato investigato il ruolo della genomica nella tassonomia ed evoluzione delle specie appartenenti al genere Lactobacillus e ai generi ad esso correlati, attraverso l'applicazione di diverse tecniche. L'interesse verso questi batteri deriva dalla presenza di specie GRAS (Generally Recognised As Safe) e per il loro importante ruolo nella produzione di alimenti fermentati. Inoltre, alcuni ceppi di origine umana sono utilizzati come probiotici o vettori vaccinali. Nella prima parte della tesi, l’aggiornamento tassonomico del genere Lactobacillus sulla base dell'analisi comparativa del gene 16S rRNA ha rivelato come esso sia caratterizzato da una complessa storia evolutiva, i cui membri sono combinati con le specie del genere Pediococcus. In aggiunta, la maggior parte delle specie del genere Lactobacillus è inclusa in 15 gruppi filogenetici supportati dal punto di vista statistico; tuttavia le specie appartenenti allo stesso gruppo non sempre condividono le stesse proprietà fenotipiche, soprattutto per quanto riguarda il metabolismo dei carboidrati, sul quale si è sempre basata l’analisi tassonomica classica dei lattobacilli. Infine, due specie, Lactobacillus catenaformis e L. vitulinus si sono rivelate correlate alle specie appartenenti al gruppo XVII del subphylum Clostridium, e quindi sono stati riclassificate rispettivamente in Eggerthia catenaformis e Kandleria vitulina. La presenza di gruppi filogenetici consistenti e la discrepanza tra i dati filogenetici e metabolici hanno costituito il substrato appropriato per l'integrazione dei dati genomici, conseguita nella seconda parte del presente studio. Il primo approccio genomico ha previsto l’analisi comparativa del background genetico relativo alle due vie metaboliche principali del metabolismo dei carboidrati, glicolisi e via dei pentoso fosfati, condotta sui genomi di 42 ceppi appartenenti ai generi dei batteri lattici dell’ordine Lactobacillales. L’indagine si è focalizzata sulla distribuzione del contenuto genico e dell’ordine dei geni sul cromosoma e ha fornito nuove informazioni riguardanti le basi genetiche del metabolismo omo/eterofermentante oltre che rivelare specifici eventi di perdita o acquisto di geni appartenenti alle due vie di interesse, in particolare per i membri del gruppo filogenetico di Lactobacillus delbrueckii, la specie tipo del genere Lactobacillus. La peculiare distribuzione di 5 geni della glicolisi (pdhA, pdhB, PdhC, pdhD e pfkA) nei ceppi sequenziati del gruppo L. delbrueckii ha motivato la validazione tassonomica di questi putativi marcatori sui ceppi tipo di tutte le specie appartenenti a questo gruppo, i quali hanno rivelato un background genotipico omogeneo (assenza di pdhA, pdhB, pdhC e pdhD e presenza del gene pfkA), nonostante la loro eterogeneità dal punto di vista metabolico. Questi dati rappresentano un passo-chiave per la risoluzione della discrepanza che caratterizza la tassonomia dei lattobacilli, in quanto è stata ritrovata una corrispondenza tra il background genotipico relativo al metabolismo degli zuccheri e i dati filogenetici. Inoltre, questi risultati hanno dimostrato come l'approccio proposto, basato sulla genomica comparativa e sull’analisi evolutiva e successiva validazione tassonomica sui ceppi di tipo, rappresenta un efficace modus operandi utile alla risoluzione delle problematiche tassonomiche e per la corretta caratterizzazione dei taxa. Nell'ultima parte dello studio, è stato dimostrato come il genoma di un singolo ceppo costituisca una risorsa fondamentale per lo sviluppo di uno schema di tipizzazione MultiLocus Sequence Typing (MLST) e quindi sia un valido supporto per lo studio dell'analisi intraspecifica di una collezione di ceppi. Un altro risultato importante di questo progetto è il contributo metodologico derivante dai dati genomici, che sono stati integrati con diverse metodiche combinate che coinvolgono filogenesi molecolare, analisi del contenuto genico e dell'ordine dei geni sul cromosoma, l’analisi a network e MLST. In conclusione, l'analisi tassonomica del genere Lactobacillus, in particolare, e dei generi ad esso correlati, ha mostrato come l'integrazione dei dati genomici costituisca un potente supporto per la descrizione tri-dimensionale dei taxa batterici, creando un collegamento tra i criteri tassonomici attuali e armonizzando i dati fenotipici, filogenetici e genotipici.
genomics; taxonomy; evolution; Lactobacillus; lactic acid bacteria
Bacterial taxonomy is a fundamental discipline in microbiology since it provides an operative and predictive classification system, and constitutes a framework for application (i.e., reliable identification of microorganisms), scientific communication and knowledge exchange. According to the prokaryotic species definition, DNA-DNA hybridization and analysis of 16S rRNA gene sequence are currently being considered the golden standard molecular criteria for prokaryotic species delineation. However, the recent availability of complete sequence of prokaryotic genomes allows, for the first time, the fulfill investigation of the genomic relatedness between organisms and gives the opportunity to reconstruct events of genome evolution and understand the natural relationships between microorganisms. In the present research project the role of genomics was investigated for the taxonomy and evolution of Lactobacillus genus and related genera in different taxonomic ranks, through the application of several techniques. The interest in these bacteria derives from the presence of the highest number of GRAS species (Generally Recognised As Safe) and for their role in fermented food production. Moreover, certain strains of human origins are being exploited as probiotics or vaccine carriers. In the first part of the dissertation, the taxonomic analysis of Lactobacillus genus based on the comparative analysis on 16S rRNA gene sequence confirmed the heterogeneity of this genus, which was intermixed with Pediococcus genus, and characterized by a complex evolutionary history. Furthermore, the majority of Lactobacillus species was found to be included in 15 robust subgeneric groups, but species belonging to the same cluster did not always share the same phenotypic properties, especially data coming from the analysis of carbohydrate metabolism, upon which traditional taxonomic analysis is based. Finally, two species, Lactobacillus catenaformis and L. vitulinus were found to be part of to Clostridium subphylum cluster XVII, therefore they were reclassified as Eggerthia catenaformis and Kandleria vitulina, respectively. The presence of consistent phylogenetic groups and the discrepancy between metabolic and phylogenetic data constituted the appropriate taxonomic framework for genome data integration, which was applied in the second part of the present study. The genetic background of the metabolic pathways related to carbohydrate metabolism, i.e. glycolysis and pentose phosphate pathway, was analysed in 42 strains belonging to Lactobacillus and related genera of order Lactobacillales: the investigation of gene order and distribution provided new information concerning the genetic bases of heterofermentative/homofermentative metabolism in lactic acid bacteria and lineage specific trends of gene loss/gain within the two metabolic pathways, in particular for Lactobacillus delbrueckii-group. The detection of peculiar glycolytic gene distribution in Lactobacillus species belonging to different metabolic groups in terms of presence/absence of five putative markers (pdhA, pdhB, pdhC, pdhD and pfkA) motivated the taxonomic validation of these data on the type strains of species belonging to L. delbrueckii-group, as the first step towards a genome-based taxonomy of Lactobacillus. A coherent genetic background (absence of pdhA, pdhB, pdhC, pdhD, and presence of pfkA) was detected for species of L. delbrueckii-group despite their metabolic heterogeneity. These data represent a key-step for the resolution of Lactobacillus taxonomy, since a matching between the genotypic background related to carbohydrate metabolism and phylogenetic data was found for L. delbrueckii-group, denoted here as Lactobacillus sensu stricto, due to its diversity from the rest of lactobacilli, as it was revealed from comparative genomic analysis. Furthermore these results demonstrated that the proposed approach, based on comparative genomics and evolutionary analysis and then taxonomic validation on the type strains, can represent a successful modus operandi to resolve taxonomic issues and for the correct characterization of taxa. In the last part of the study, a single sequenced genome was shown to constitute a fundamental resource for the development of a Multilocus Seqeunce Typing (MLST) scheme, thus demonstrating that the availability of a single sequenced strain (even if a non type-strain) is a valuable support for the investigation of the intraspecific analysis of a panel of strains and a genome-based indication for the sequencing of other strains. Another important outcome of this project is the methodological contribution derived from genome data, which were integrated with different combinations involving molecular phylogeny, analysis of pathway gene content and order, split decomposition and MLST. In conclusion, the taxonomic analysis of Lactobacillus genus and related genera has shown that genome data integration is a powerful support for the creation of a tri-dimensional description of taxa, which creates a link between current taxonomic criteria and harmonizes genotypic, phylogenetic and phenotypic data.
File in questo prodotto:
File Dimensione Formato  
PDF_UNICO 2.pdf

non disponibili

Tipologia: Tesi di dottorato
Licenza: Accesso ristretto
Dimensione 14.29 MB
Formato Adobe PDF
14.29 MB Adobe PDF   Visualizza/Apri   Richiedi una copia

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11562/394128
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact