le séquençage du génome de l’aurochs sauvage eurasien éteint, Bos primigenius, éclaire la phylogéographie et l’évolution du bétail

couverture de la séquence du génome de L’Aurochs

Les données de séquençage du génome nucléaire de B. primigenius ont été alignées sur le génome de référence UMD3.1 de B. taurus . À cette fin, six bibliothèques D’ADN (C1–C6) ont été préparées indépendamment à partir de six extractions distinctes de poudre d’OS d’aurochs., Ces bibliothèques ont été utilisées pour le séquençage à lecture unique (SR; bibliothèques C1-C3) et à extrémité appariée (PE; bibliothèques C4–C6) avec les plates-formes Illumina® Genome Analyzer IIx et HiSeq 2000 (Fichier supplémentaire 1: Figure S1 et tableau S1). Le classement des données de toutes les bibliothèques a donné un total de 3,37 milliards de lectures de séquences, dont la longueur de lecture brute varie de 36 à 70 bp (fichier supplémentaire 1: Tableau S2). Un filtrage ultérieur pour supprimer les lectures qui étaient mal séquencées, de faible complexité ou qui consistaient en grande partie ou entièrement en adaptateurs de séquençage Illumina® a donné 2.,86 milliards de lectures filtrées pour l’alignement sur le génome de référence. De ce nombre, 805 millions de lectures (28,1 %) ont été mappées au génome de référence UMD3.1. La suppression des lectures en double (c.-à-d. les lectures de la même bibliothèque de séquençage qui ont été mappées à la même position nucléotidique sur le même brin chromosomique) a donné 619,7 millions de lectures et la suppression subséquente des lectures mappées à plusieurs emplacements a produit un total de 470 millions de lectures mappées de manière unique, dont 417 millions de lectures mappées à des scores de qualité de carte Phred ≥30 (fichier supplémentaire 1: Tableau S3). Les 470 millions de lectures mappées de manière unique comprenaient 16.,62 Go de séquences nucléaires d’aurochs et d’ADNmt et couvert 2,37 Go du génome nucléaire de B. taurus (89,43% de L’assemblage du génome bovin UMD3.1 de 2,65 Go) avec une profondeur de séquençage moyenne de 6,23× à toutes les positions nucléotidiques (fichier supplémentaire 1: Tableau S4). De plus, 63 174 de ces 470 millions de lectures (comprenant 2 582 767 bp) ont été alignées sur la séquence d’ADNmt de L’haplogroupe P de B. primigenius 16 338 bp précédemment rapportée par nous . Cela a donné une profondeur de séquence moyenne de 158,06× pour toutes les positions de nucléotides de l’ADNmt de B. primigenius.,

un diagramme de dispersion généré pour le nombre de lectures alignées de haute qualité sur des chromosomes individuels a révélé une densité de lecture moyenne uniforme pour tous les autosomes. Cependant, la densité des lectures mappées au chromosome X était d’environ 50% celle de la densité de lecture autosomique, ce qui démontre que le spécimen osseux CPC98 provient d’un animal mâle (fichier supplémentaire 1: Figure S2).,

authenticité de la séquence du génome de L’Aurochs

des études Antérieures ont montré que l’analyse de L’ADN ancien (aDNA) est très sensible à deux principales sources d’erreur pouvant entraîner la génération de données de séquence D’ADN inauthentiques: (1) contamination par de L’ADN dérivé d’échantillons exogènes modernes; et (2) modification nucléotidique post-mortem, principalement la désamination de la cytosine en résidus d’uracile qui provoque un taux élevé de transitions C → T artefactuelles dans L’ADN nouvellement synthétisé au cours de la réaction en chaîne de la polymérase (PCR) amplification et séquençage ., Par conséquent, nous avons analysé les contributions possibles des deux sources d’erreur dans la séquence du génome de l’aurochs.

Tout d’abord, la séquence complète de l’ADNmt CPC98 a été utilisée pour estimer la quantité de contamination de l’ADN bovin moderne (fichier supplémentaire 1: méthodes supplémentaires, Section 7). Pour cela, nous avons catalogué les SNP ADNmt en distinguant les trois séquences complètes d’haplogroupe P actuellement disponibles d’un panel de 233 séquences modernes complètes de macro-haplogroupe T et I et les séquences D’haplogroupe Q et R extraites de GenBank. Cette analyse a identifié 15 SNP discriminants de l’haplogroupe p., Les appels de nucléotides pour les 15 positions SNP des lectures CPC98 individuelles ont été classés comme étant d’aurochs ou d’origine moderne selon l’allèle qu’ils possédaient. Au total, 1 959 lectures CPC98 individuelles ont parcouru les 15 SNP discriminants de L’haplogroupe P, dont 10 lectures ont montré une caractéristique d’allèle des séquences d’ADNmt T, Q, R et/ou I, donnant une estimation supérieure de la contamination de l’ADNmt bovin moderne dans le spécimen CPC98 de 0,51 % (fichier supplémentaire 1: Tableau S5)., Bien que cette estimation soit comparable aux niveaux de contamination moderne par l’ADNmt observés pour des génomes humains entiers de Néandertal, de Denisovan et du Pléistocène , elle se situe également dans le taux d’erreur de séquence rapporté des plates-formes Illumina® GA IIx et HiSeq 2000 . Pour affiner davantage l’estimation de la contamination moderne par l’exclusion des transitions qui peuvent être affectées par une mauvaise incorporation des nucléotides diagénétiques, nous avons examiné le nombre de lectures CPC98 couvrant la mutation unique de type transversion (position 14,129)., Un total de 97 lectures CPC98 couvraient cette position, toutes affichant la variante de L’haplogroupe P, donnant une estimation moderne de la contamination basée uniquement sur des transversions de 0,00 %.

la contamination potentielle de l’ADN nucléaire a été estimée en tirant parti du chromosome X hémizygote dans le spécimen CPC98 mâle et en identifiant des SNP diagnostiques dans la partie non recombinante du chromosome X (Fichier supplémentaire 1: méthodes supplémentaires, Section 7). En utilisant des critères de filtrage stricts, cette procédure a donné des estimations supérieures de la contamination de l’ADN nucléaire européen de la taurine et du zébu de 3,4% et 0.,2 %, respectivement. Il est important de noter qu’il existe un biais potentiel dans ces estimations parce que le génome de référence dans tous les alignements a été généré à partir d’un animal européen taurine Hereford . Par conséquent, les fausses lectures portant l’allèle de la taurine européenne auront des scores d’alignement plus élevés que les fausses lectures portant l’allèle du zébu, ce qui tendrait à élever l’estimation de la contamination de la taurine européenne par rapport à l’estimation du zébu., En outre, cette procédure suppose qu’il n’y a pas d’erreurs d’assemblage ou de variations de nombre de copies qui modifieraient l’attente de génotypes haploïdes à ces positions SNP chromosomiques X dans CPC98.

la Variation de la distribution des longueurs de fragments d’ADN obtenus à partir de spécimens anciens a également été utilisée comme mesure indirecte pour estimer l’étendue de la contamination de l’ADN moderne . La fragmentation Post mortem est une caractéristique de l’aDNA, avec des séquences endogènes authentiques ayant généralement une taille de fragment inférieure à 200 PB ., La taille médiane des fragments d’aurochs a été estimée à 50 PB en utilisant les lectures de séquences PE cartographiées de manière unique (17,8 millions de lectures comprenant 994,4 Mo), 99,99% des inserts cartographiables variant entre 16 et 150 PB et 99,19% de celles-ci variant entre 20 et 150 PB (fichier supplémentaire 1: Figure S3). Ces résultats concordent avec les longueurs de fragments d’ADN endogènes rapportées pour les spécimens d’hominines paléolithiques, qui présentent généralement des tailles moyennes de 30 à 100 pb .,

Nous avons précédemment estimé l’étendue de l’erreur de séquençage de l’ADN pour le spécimen CPC98 en comptant les appels de nucléotides non consensuels provenant de lectures individuelles d’ADNmt qui différaient de la séquence consensuelle D’ADNmt CPC98 . Nous avons répété cette analyse en utilisant le plus grand nombre de lectures de séquences mappées à la séquence du génome de l’haplogroupe P de l’ADNmt bovin obtenu pour la présente étude. Notamment, l’augmentation du nombre de lectures de séquence d’ADNmt n’a révélé aucun excès des transitions C → T caractéristiques en raison de la désamination post-mortem de la cytosine dans les lectures de séquence CPC98 individuelles., L’absence de désamination post-mortem significative de la cytosine peut être attribuable à L’ADN polymérase haute fidélité de Phusion utilisée lors de la préparation de la bibliothèque. Il a été démontré que cette polymérase amplifie de manière inefficace les fragments D’ADN contenant des résidus d’uracile générés par la désamination de la cytosine ; cependant, cette enzyme peut amplifier les fragments contenant des résidus de thymine générés par la désamination post-mortem des 5′-méthyl-cytosines endogènes (5meC)., Par conséquent, nous reconnaissons que bien que les erreurs de séquence d’ADN observées dans la présente étude soient très probablement des artefacts des méthodes de séquençage d’ADN utilisées, les lectures CPC98 individuelles affichant des transitions C → T peuvent avoir été générées, en partie, par des processus de désamination post-mortem 5meC .

les résultats de l’analyse mapDamage 2.0 pour un sous-ensemble de lectures de séquence mettent en évidence les augmentations des transitions C → T et G → A typiques des modèles de dommages aDNA aux extrémités 5′ et 3′ des lectures, respectivement (fichier supplémentaire 1: Figure S4)., Cependant, ces augmentations sont inférieures à celles observées dans d’autres OS d’âge similaire; par exemple, celles récemment rapportées par Gamba et ses collègues . Les explications possibles de cette réduction des dommages observables à l’ADN peuvent inclure l’utilisation de la polymérase Phusion comme documenté ci-dessus, ainsi que L’étape de ligature Illumina® at-overhang utilisée dans le protocole de préparation de la bibliothèque, qui a déjà été démontré pour interdire la ligature des cytosines endommagées .

pris ensemble, ces résultats confirment l’authenticité des lectures de séquences de B. primigenius obtenues à partir des bibliothèques CPC98.,

analyse des variants de séquence D’ADN de L’Aurochs

un total de 5 233 471 variants de séquence d’ADN différenciant le cpc98 et le génome de référence ont été identifiés. Parmi ceux-ci, 2 135 925 ont réussi un filtre de qualité composite comprenant un seuil de profondeur de lecture minimum de 5× et un logarithme recalibré de la cote (LOD) supérieur à 2 (Tableau 1). En bref, ces ~2,1 millions de variants comprenaient 2 009 261 SNP bialléliques (dont 73,3% étaient homozygotes) et 104 655 indels (dont 86,3% étaient homozygotes). Le rapport de transition vers la transversion (ti/tv) a été estimé à 2,19:1.,00, Qui est similaire au rapport ti/tv obtenu à partir d’une séquence génomique Holstein femelle (2,18:1,00) . Le package VEP (variant Effect Predictor) D’Ensembl a été utilisé pour déterminer l’effet des variations de la séquence D’ADN de l’aurochs (c.-À-D. SNPs et indels) sur les gènes, les transcriptions, la séquence protéique et les régions régulatrices (fichier supplémentaire 2). Nous avons constaté que 96,9% des SNP CPC98 et 94,2% des indels CPC98 étaient précédemment décrits et présents dans dbSNP build 140., Les variants homozygotes étaient nettement plus susceptibles d’être décrits précédemment, et les SNP de transition légèrement plus susceptibles que les transversions (Tableau 1). Nous avons également recoupé les variants CPC98 avec un ensemble de SNP et d’indels détectés par des données de séquençage du génome à couverture superficielle (128,4×) provenant de 81 échantillons modernes de taurine et de zébu représentant 11 races originaires d’Europe, D’Afrique et d’Inde (fichier supplémentaire 1: méthodes supplémentaires, Section 8.2). Chez ces animaux modernes re-séquencés, 84,9% des SNP CPC98 et 81,3% des indels CPC98 étaient présents., La forte proportion de SNP CPC98 et d’indels décrits précédemment soutient l’authenticité de ces variantes.

Tableau 1 variants SNP et indel détectés entre le génome de référence UMD3.1 DE B. taurus et le spécimen d’aurochs CPC98

Bos primigenius Nord-Européen: un groupe évolutif de bovins taurins modernes

un grand ensemble de données SNP de référence pour les analyses phylogénétiques et génétiques des populations a été assemblé à partir d’études publiées précédemment., Il s’agissait de données de génotype Illumina® BovineSNP50 provenant de 1 228 bovins individuels comprenant le spécimen CPC98; 1 225 échantillons provenant de 73 populations de bovins modernes (représentant des populations européennes et africaines de B. taurus, asiatiques DE B. indicus et diverses croisées de B. taurus × B. indicus et africaines de B. taurus × européennes de B. taurus); et deux échantillons de yaks (B. grunniens) (fichier supplémentaire 1: Tableau S6). Cet ensemble de données SNP a été filtré pour retenir 15 498 SNP autosomiques couverts à une profondeur de lecture ≥10 dans les données de séquence du génome CPC98 et un taux de génotypage ≥90% chez tous les 1 228 animaux de L’ensemble de données BovineSNP50., De plus amples renseignements sur cet ensemble de données SNP de référence sont fournis dans le fichier supplémentaire 1: méthodes supplémentaires, Section 8.3.

le progiciel SNPhylo a été utilisé avec l’ensemble de données SNP de bovins pour générer un arbre phylogénétique du maximum de vraisemblance (ML) (fig. 2). Pour cette analyse, L’ensemble de données BovineSNP50 a été filtré à l’aide d’un seuil de déséquilibre de liaison (r 2 ≤ 0,5) pour générer un sous-ensemble de 10 923 SNP de haute qualité., Pour plus de clarté visuelle, l’arbre a été construit avec un panel réduit de 278 bovins représentatifs (un maximum de cinq animaux échantillonnés aléatoirement par race de 59 races modernes à l’exclusion des populations croisées de B. taurus × B. indicus et de B. taurus Africain × B. taurus européen) (fichier supplémentaire 1: Tableau S6). Les valeurs de support Bootstrap pour la phylogénie ont été générées à l’aide de 100 pseudoreplicats des génotypes SNP. La phylogénie présentée à la Fig., 2 a également été validé avec une arborescence ML supplémentaire (fichier supplémentaire 1: Figure S5) avec un support bayésien pour chaque branche générée à l’aide du paquet PhyML . L’arbre montre une séparation complète des populations de taurine et de zébu, illustrant la divergence évolutive entre les deux taxons et soutenant les origines domestiques distinctes de B. taurus et de B. indicus . Il est important de noter, cependant, que le biais de détermination SNP inhérent à la conception du test Illumina® BovineSNP50 peut avoir un effet détectable sur la divergence estimée entre le B. taurus européen et d’autres groupes de bovins ., Le spécimen britannique CPC98 aurochs est un outgroup-avec 100% de soutien bootstrap—à l’ensemble du clade moderne de B. taurus dans cette phylogénie. Ceci est corroboré par le diagramme d’analyse en composantes principales illustré à la Fig. 3 dans lequel CPC98 est périphérique au groupe d’échantillon européen de B. taurus le long de la composante principale 1. Ces résultats appuient fortement l’hypothèse selon laquelle l’aurochs D’Europe du nord est un sous-groupe évolutif de tous les bovins taurins domestiqués .

Fig., 2

arbre phylogénétique du maximum de vraisemblance construit avec un panel réduit de 278 Animaux utilisant 10 923 polymorphismes de nucléotides simples filtrés de haute qualité. Les valeurs de support de Bootstrap pour la phylogénie ont été générées en utilisant 100 pseudoreplicats des génotypes de polymorphisme nucléotidique unique et les valeurs de distance p ont été utilisées pour les distances évolutives entre les animaux individuels

Fig., 3

Les diagrammes d’analyse en composantes principales construits pour les composantes principales (PC) 1 et PC2 sont présentés pour 1 226 animaux à l’aide de 12 874 polymorphismes de nucléotides simples filtrés de haute qualité. La position du spécimen d’aurochs CPC98 est mise en évidence., Le diagramme d’histogramme plus petit montre les contributions de variance relative pour les 10 premiers PC

pour étudier la structure génétique et l’historique des mélanges des populations et des aurochs analysés, STRUCTURE a été exécuté à l’aide des données BovineSNP50 de tous les échantillons (fichier supplémentaire 1: Tableau S6). Les résultats de cette analyse pour K = 3 sont illustrés à la Fig. 4 et les diagrammes de STRUCTURE pour les valeurs K supplémentaires (4 et 5) sont présentés dans le fichier supplémentaire 1: Figure S6., En utilisant tous les groupes géographiques, le modèle à trois populations (K = 3) différencie les composantes de la taurine européenne, de la taurine africaine et du zébu. Le spécimen d’aurochs CPC98 présente les contributions de chacun de ces trois groupes biogéographiques. La composante zébu détectée dans trois des quatre populations italiennes (Chianina, Marchigiana et Romagnola) et dans les deux populations taurines D’Asie de l’est (Hanwoo et Wagyu) a été supposée représenter un mélange historique de B. indicus ., Cependant, la structure génétique tripartite observée dans le spécimen D’aurochs CPC98 soutient une hypothèse alternative, selon laquelle les allèles maintenant exclusifs aux bovins africains et asiatiques ont peut-être déjà été présents plus largement avant la domestication, mais ont ensuite été perdus de la lignée européenne domestiquée de B. taurus. La question de savoir si certaines races taurines d’origine italienne et D’Asie de l’est ont conservé des allèles pré-domestiques perdus ailleurs en Europe ou ont acquis des allèles supplémentaires par hybridation avec des aurochs reste en suspens.

Fig., 4

regroupement hiérarchique non supervisé de 1 226 individus (comprenant 73 populations, où les N’Dama du Burkina Faso étaient considérés comme deux populations distinctes) à l’aide de données génotypiques pour 7 749 polymorphismes mono-nucléotidiques filtrés de haute qualité. Les résultats pour un nombre inféré de clusters K = 3 sont affichés., Taurine verte européenne, taurine Rouge Africaine, zébu violet

hybridation entre aurochs et populations de bovins domestiques en Europe

Les études sur les loci génétiques uniparentaux (ADNmt et haplotypes du chromosome Y) et la variation des marqueurs autosomiques ont été équivoques sur la question de savoir si croisement avec des aurochs sauvages locaux . La présence de présumés B., primigenius P, R, Q et, plus récemment, c ADNmt haplogroupes dans les populations de bovins domestiques modernes et précoces d’Europe et D’Asie a fourni un certain soutien à la domestication locale des femelles d’aurochs sauvages en Europe. Cependant, la grande majorité des haplotypes actuels d’ADNmt de bovins taurins (haplogroupe T) proviennent de bovins domestiqués au Proche-Orient, il est donc probable que les adoptions locales de matrilinéaires sauvages dans des bassins domestiques étaient rares., En se basant sur les distributions discontinues de deux haplogroupes distincts du chromosome Y (Y1 et Y2) chez les taureaux taurins européens, et sur le génotypage d’échantillons D’aurochs mâles européens, on a émis l’hypothèse que les bovins D’Europe du Nord conservent un haplogroupe Y (Y1) indiquant une hybridation ancienne entre les mâles sauvages de B. primigenius et les femelles domestiques de B. taurus ., Cependant, des travaux ultérieurs ont sérieusement remis en question cette interprétation et il est maintenant généralement admis que les marqueurs génétiques du chromosome Y bovin actuellement disponibles (SNP et microsatellites) sont incapables de résoudre la question de savoir si les taureaux d’aurochs européens sauvages s’accouplent avec des vaches femelles domestiques .

pour évaluer les preuves de l’hybridation post-domestication entre les aurochs Britanniques et les ancêtres des bovins Européens modernes, nous avons utilisé le test ABBA/BABA de mélange génomique ., Les résultats de cette analyse pour les races européennes individuelles sont présentés dans le fichier supplémentaire 1: Tableau S7, tandis que le fichier supplémentaire 1: Tableau S8 résume les résultats de la procédure de rééchantillonnage par bloc jackknife utilisée pour tester la signification des comparaisons statistiques D entre les principaux groupes géographiques de races. La Figure 5 montre une carte de contour des statistiques individuelles de la race européenne d tracée en fonction de l’origine de la population., Ces résultats fournissent des preuves convaincantes appuyant l’hypothèse d’une contribution génétique significative des aurochs Britanniques aux populations de bovins domestiques modernes de Grande-Bretagne et D’Irlande. En particulier, inspection du fichier supplémentaire 1: Tableau S7 et Fig. 5 démontre que cet héritage génétique ancien est le plus apparent dans les races bovines traditionnelles ou landrace D’origine écossaise, irlandaise, galloise et anglaise (c.-À-D. Highland, Dexter, Kerry, Welsh Black And White Park).

Fig., 5

carte de contour géographique de l’adjuvant génomique d’aurochs avec des statistiques individuelles de race européenne D (résultats des tests ABBA/BABA) tracées en fonction de l’origine de la population et visualisées à l’aide du composant ArcMap de la suite logicielle ArcGIS., La topologie de L’arbre de test ABBA/BABA est également montrée et la valeur du point de contour pour chaque race européenne (P1) a été générée à partir de la statistique d moyenne où P2 est définie sur chacune des sept populations de taurines ouest-africaines à tour de rôle

La migration Interpopulation entre les aurochs Britanniques programme. Fichier supplémentaire 1: Figures S7, S8 et Fig. 6 montre les résultats de ces analyses., Il est à noter que deux bords de migration des aurochs Britanniques aux ancêtres des bovins Britanniques et irlandais sont évidents dans la Fig. 6 (numéros 1 et 5). Ces résultats soutiennent également l’hypothèse d’un flux génétique important des aurochs Britanniques vers les ancêtres des bovins modernes de Grande-Bretagne et D’Irlande. Il est important de noter, cependant, que le test de mélange à trois populations n’a pas révélé de preuve de mélange significatif pour aucune des 252 combinaisons possibles de trois populations générées par le programme threepop pour les aurochs et les huit populations de bovins illustrées à la Fig. 6.,

Fig. 6

la phylogénie du maximum de vraisemblance de TreeMix avec des bords de migration a été construite à l’aide de données génotypiques (15 498 polymorphismes nucléotidiques simples) provenant de huit groupes de population de bovins régionaux européens et américains et du spécimen unique D’aurochs CPC98. Cette phylogénie a été générée avec cinq bords de migration, le premier bord de migration (marqué 1) étant supposé être une introgression d’aurochs Britanniques sauvages dans des bovins domestiques ancestraux du clade britannique, irlandais et Nord-Européen., Le cinquième bord de migration (5) est supposé être une autre introgression d’aurochs Britanniques sauvages dans le bétail domestique ancestral au sous-clade Angleterre/Pays De Galles et Irlande. La barre d’échelle montre 10 fois l’erreur type moyenne des entrées estimées dans la matrice de covariance de l’échantillon

analyses fonctionnelles des aurochs et des génomes des bovins modernes

Nous avons effectué des analyses génomiques fonctionnelles à l’aide des données de séquençage du génome entier et B., échantillons indicus (fichier supplémentaire 1: méthodes supplémentaires, Section 8.2) Pour étudier comment la domestication a pu façonner les génomes des bovins taurins modernes.

Nous avons examiné les variants SNP et indel fonctionnellement significatifs apparaissant après la domestication chez le B. taurus européen et augmentant jusqu’à la fixation, éventuellement par sélection. Les SNP et les indels ont été filtrés pour retenir ceux qui étaient proches de la fixation (≥95 %) pour différents allèles dans les groupes bovins européens de B. taurus et de B. indicus, et pour lesquels le spécimen d’aurochs CPC98 était homozygote pour L’allèle majeur de B. indicus., L’outil Ensembl VEP a été utilisé pour filtrer ces 263 variants associés à des gènes en excluant les variants introniques et intergéniques et en ne conservant que les variants dans les exons, les régions non traduites de 5′ et 3′ (UTR) et les séquences flanquantes de 5 kb en amont ou en aval des limites des gènes (fichier supplémentaire 1: Tableau S9). On a émis l’hypothèse que ces 263 variants ont émergé dans la lignée européenne de B. taurus après la domestication et huit mutations missense identifiées dans le cadre de cette analyse sont détaillées dans le fichier supplémentaire 1: Tableau S10., Il est à noter que deux de ces mutations missense ont été localisées dans des gènes de récepteurs olfactifs (ENSBTAG00000024891, ENSBTAG00000019925). Ces dernières années, des analyses comparatives du génome entier ont mis en évidence les gènes de l’olfaction comme cibles de sélection pendant et après la domestication pour une gamme d’espèces de mammifères, y compris les chats, les chiens, les porcs et les chevaux . L’une des huit mutations missense a également été observée dans le gène DGAT1, qui abrite un nucléotide de caractère quantitatif majeur pour les caractères laitiers et a fait l’objet d’une sélection intense chez de nombreuses populations de bovins laitiers .,

cent quatre-vingt-treize gènes ont été associés aux 263 variants européens de B. taurus post-domestication et ceux-ci ont été analysés à L’aide D’Ingenuity® Systems Pathway Analysis (IPA). Le sous-ensemble de 166 gènes mappables aux molécules de la base de connaissances de L’IPA a été enrichi pour les fonctions neurobiologiques, de signalisation immunitaire, de croissance et de métabolisme (fichier supplémentaire 1: tableaux S11 et S12), ce qui suggère que ces processus biologiques ont joué un rôle important dans la domestication et l’évolution subséquente des bovins européens de B. taurus.,

Nous avons également utilisé le test Hudson-Kreitman-Aguadé (HKA) pour étudier les régions génomiques en cours de sélection dans la lignée de B. taurus. Le test HKA est basé sur le rapport entre la diversité au sein d’un ingroup de séquences D’ADN et la distance à un outgroup . En l’absence de balayages sélectifs, ce rapport devrait être constant dans tout le génome; cependant, les balayages sélectifs, qui entraînent une réduction de la taille effective de la population, devraient atténuer la diversité des séquences d’ADN du groupe. Toutes les séquences du génome de B. taurus et le génome de L’aurochs CPC98 ont été inclus pour l’analyse HKA, avec B., taurus considéré comme l’ingroup et le spécimen CPC98 comme l’outgroup. Les régions du génome présentant une sélection positive sont indiquées dans le fichier supplémentaire 1: Figure S9. Les résultats HKA présentés à la Fig. S9 n’étaient pas significatifs lorsqu’ils étaient ajustés pour les tests multiples (méthode du taux de fausse découverte de Benjamini-Hochberg ); par conséquent, ces résultats devraient être considérés comme suggestifs. Nonobstant cela, dans les régions présentant une sélection positive dans la lignée de B. taurus à P ≤ 0.,05 (fichier supplémentaire 1: Tableau S13), nous avons trouvé un total de 106 loci candidats uniques annotés (y compris les gènes codant les protéines et les miARN). Parmi ceux-ci, 96 gènes ont été mappés à des molécules dans la base de connaissances de L’IPA et ont été utilisés pour identifier des catégories fonctionnelles biologiques enrichies pour des gènes potentiellement sous sélection positive.,

parmi les catégories fonctionnelles les plus importantes pour les analyses HKA (fichier supplémentaire 1: Tableau S14) figuraient des gènes impliqués dans la neurobiologie, ainsi que le développement et la fonction musculaire, ce qui appuie les hypothèses selon lesquelles le processus de domestication s’est accompagné d’une sélection pour les traits comportementaux et carnés. L’analyse des voies fonctionnelles a également révélé un enrichissement des gènes impliqués dans le développement du système hématologique et l’immunité (fichier supplémentaire 1: Tableau S15)., Cette observation pourrait refléter l’adaptation des premiers domestiqués à une interaction accrue avec les humains et à une exposition concomitante à de nouveaux agents pathogènes en raison d’un confinement accru dans des systèmes gérés d’élevage et d’élevage . En effet, des études récentes chez les mammifères domestiques ont rapporté que les gènes liés au système immunitaire sont sujets à une sélection positive contre les agents pathogènes en évolution rapide .

enfin, afin D’identifier les polymorphismes associés à la régulation différentielle des miarns, nous avons passé au crible 659 gènes de miARN orthologues pour rechercher des polymorphismes différenciant le génome de l’aurochs des 81 gènes B modernes., génomes du taureau séquencés pour cette étude (fichier supplémentaire 1: méthodes supplémentaires, Section 8.2). Nous avons identifié cinq gènes de miARN contenant des polymorphismes de miARN matures, dont un polymorphisme dans la région de la graine de miR-2893 (fichier supplémentaire 1: Figure S10). De tels polymorphismes géniques de miARN peuvent entraîner des changements de régulation dans l’ensemble des ARNm ciblés par un miARN (fichier supplémentaire 1: Tableau S16). L’analyse IPA des différents ensembles de cibles génétiques a révélé un enrichissement des voies canoniques impliquées dans le guidage axonal, la signalisation mTOR et la signalisation androgène pour le B., taurus BTA-mir-2893 variante, mais pas pour le B. primigenius bpr-mir-2893 variante. En revanche, les voies de signalisation du développement des mélanocytes et de la pigmentation ont été enrichies pour les cibles génétiques de la variante aurochs bpr-mir-2893, mais pas pour bta-miR-2893 (fichier supplémentaire 1: Figure S11). Parmi les gènes ciblés par la variante bpr-miR-2893, mais pas la variante bta-miR-2893, figuraient PHYHIP et FADS2, qui sont impliqués dans le neurodéveloppement et le métabolisme des acides gras, respectivement ., Inversement, les gènes ciblés spécifiquement par la variante bta-miR-2893 mais pas la variante bpr-mir-2893 comprenaient FCRL1, qui a un rôle immunologique . Ces résultats indiquent que la sélection de variants régulateurs de miARN (tels que bta-miR-2893) ayant des rôles dans la neurobiologie, la fonction immunitaire, la croissance et le métabolisme ont contribué à l’évolution récente des bovins modernes.

Author: admin

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *