NCBI Gavialis gangeticus Annotation Release 100

The RefSeq genome records for Gavialis gangeticus were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
Alignment of the annotated proteins to a set of high-quality proteins: The number of annotated proteins with hits to a set of high-quality proteins
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Gavialis gangeticus Annotation Release 100

Annotation release ID: 100
Date of Entrez queries for transcripts and proteins: Dec 12 2016
Date of submission of annotation to the public databases: Dec 16 2016
Software version: 7.2

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
GavGan_comp1	GCF_001723915.1	The International Crocodilian Genomes Working Group	09-13-2016	Reference	1 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	GavGan_comp1
Genes and pseudogenes	18,874
protein-coding	14,325
non-coding	4,352
pseudogenes	197
genes with variants	5,931
mRNAs	27,281
fully-supported	25,496
with > 5% ab initio	522
partial	761
with filled gap(s)	0
known RefSeq (NM_)	0
model RefSeq (XM_)	27,281
Other RNAs	5,319
fully-supported	5,003
with > 5% ab initio	0
partial	0
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	5,003
CDSs	27,304
fully-supported	25,496
with > 5% ab initio	755
partial	764
with major correction(s)	296
known RefSeq (NP_)	0
model RefSeq (XP_)	27,281

Detailed reports

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	18,677	63,025	21,923	68	2,526,522
All transcripts	32,600	3,096	2,565	62	110,468
mRNA	27,281	3,477	2,890	237	110,468
misc_RNA	476	2,862	2,396	118	13,773
tRNA	316	74	73	68	84
lncRNA	4,527	1,039	649	62	9,279
Single-exon transcripts	429	1,982	1,570	239	8,317
coding transcripts (NM_/XM_ )	429	1,982	1,570	239	8,317
CDSs	27,281	2,092	1,521	96	109,266
Exons	191,223	281	132	1	17,106
in coding transcripts (NM_/XM_ )	178,344	275	132	1	17,106
in non-coding transcripts (NR_/XR_ )	16,597	324	122	2	8,520
Introns	172,065	7,647	1,791	30	1,074,590
in coding transcripts (NM_/XM_ )	163,633	7,545	1,746	30	1,074,590
in non-coding transcripts (NR_/XR_ )	12,041	8,766	2,907	30	709,106

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	1.76	1	1	36
Number of exons per transcript	12.07	9	1	330

Alignment of the annotated proteins to a set of high-quality proteins

The final set of annotated proteins was searched with BLASTP against the UniProtKB/Swiss-Prot curated proteins, using the annotated proteins as the query and the high-quality proteins as the target. Out of 14302 coding genes, 13968 genes had a protein with an alignment covering 50% or more of the query and 9701 had an alignment covering 95% or more of the query.

Definition of query and target coverage. The query coverage is the percentage of the annotated protein length that is included in the alignment. The target coverage is the percentage of the target length that is included in the alignment.

Below is a cumulative graph displaying the number of genes with alignments above a given query or target coverage threshold. For comparison, corresponding statistics for other organisms annotated by the NCBI eukaryotic annotation pipeline were added to the graph.

Query: annotated proteins
Target: UniProtKB/Swiss-Prot curated proteins

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker for each assembly. RepeatMasker results are only used for organisms for which a comprehensive repeat library is available.

For this annotation run, transcripts and proteins were aligned to the genome masked with WindowMasker only.

Assembly name	Assembly accession	% Masked with RepeatMasker	% Masked with WindowMasker
GavGan_comp1	GCF_001723915.1	27.20%	20.41%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Depending on the other evidence available, long 454 reads (with average length above 250 nt) may be aligned as traditional evidence and reported in the Transcript alignments section or aligned with RNA-Seq reads and reported in the RNA-Seq alignments section.

Transcript alignments

No transcript evidence was used in this annotation

RNA-Seq alignments

The following RNA-Seq reads from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics, by sample (SAME, SAMN, SAMD, DRS)

Sample Id	Track name	Number of reads	Percent aligned reads	Percent spliced reads	Number of introns
All	Aggregate of all aligned samples	6,010,206,441	58%	13%	222,049
SAMD00042712	gonad (Alligator mississippiensis, SAMD00042712)	31,575,424	70%	15%	158,126
SAMD00042713	gonad (Alligator mississippiensis, SAMD00042713)	20,513,146	68%	15%	144,596
SAMD00042714	gonad (Alligator mississippiensis, SAMD00042714)	20,073,180	69%	15%	146,857
SAMD00042715	gonad (Alligator mississippiensis, SAMD00042715)	13,558,860	74%	9%	121,726
SAMD00042716	gonad (Alligator mississippiensis, SAMD00042716)	10,020,234	69%	14%	122,595
SAMD00042717	gonad (Alligator mississippiensis, SAMD00042717)	27,213,920	71%	14%	153,155
SAMD00042718	gonad (Alligator mississippiensis, SAMD00042718)	60,858,148	73%	12%	169,473
SAMD00042719	gonad (Alligator mississippiensis, SAMD00042719)	14,779,790	75%	10%	126,581
SAMD00042720	gonad (Alligator mississippiensis, SAMD00042720)	23,428,614	69%	14%	149,412
SAMD00042721	gonad (Alligator mississippiensis, SAMD00042721)	12,902,240	69%	14%	130,191
SAMD00042722	gonad (Alligator mississippiensis, SAMD00042722)	30,416,044	68%	14%	155,382
SAMD00042723	gonad (Alligator mississippiensis, SAMD00042723)	19,526,008	67%	15%	143,929
SAMD00042724	gonad (Alligator mississippiensis, SAMD00042724)	14,165,432	68%	14%	131,615
SAMD00042725	gonad (Alligator mississippiensis, SAMD00042725)	15,468,758	68%	15%	136,824
SAMD00042726	gonad (Alligator mississippiensis, SAMD00042726)	42,108,266	66%	14%	162,103
SAMD00042727	gonad (Alligator mississippiensis, SAMD00042727)	22,338,950	68%	15%	145,156
SAMD00042728	gonad (Alligator mississippiensis, SAMD00042728)	29,981,026	69%	15%	157,039
SAMD00042729	gonad (Alligator mississippiensis, SAMD00042729)	39,568,942	69%	15%	163,528
SAMD00042730	gonad (Alligator mississippiensis, SAMD00042730)	21,456,980	68%	15%	143,469
SAMD00042731	gonad (Alligator mississippiensis, SAMD00042731)	32,216,966	69%	15%	159,312
SAMD00042732	gonad (Alligator mississippiensis, SAMD00042732)	77,090,342	67%	15%	177,143
SAMD00042733	gonad (Alligator mississippiensis, SAMD00042733)	27,339,788	68%	15%	154,111
SAMD00042734	gonad (Alligator mississippiensis, SAMD00042734)	24,687,890	68%	15%	146,897
SAMD00042735	gonad (Alligator mississippiensis, SAMD00042735)	33,282,638	70%	15%	158,395
SAMD00042736	gonad (Alligator mississippiensis, SAMD00042736)	27,624,696	69%	15%	152,172
SAMD00042737	gonad (Alligator mississippiensis, SAMD00042737)	22,097,744	68%	15%	141,977
SAMD00042738	gonad (Alligator mississippiensis, SAMD00042738)	23,668,002	69%	15%	139,511
SAMD00042739	gonad (Alligator mississippiensis, SAMD00042739)	12,400,268	68%	14%	130,121
SAMN00004621	Brain cDNA from Alligator mississippiensis (American alligator, juvenile male) (Alligator mississippiensis, SAMN00004621)	438,029	74%	10%	10,292
SAMN01823432	liver (Alligator mississippiensis, Adult, SAMN01823432)	72,260,274	60%	11%	139,437
SAMN02334983	blood (Alligator sinensis, SAMN02334983)	53,333,334	25%	6%	25,861
SAMN02334984	ovary (Alligator sinensis, SAMN02334984)	53,333,334	70%	15%	139,344
SAMN02334985	adult scale (Alligator sinensis, SAMN02334985)	53,333,334	47%	10%	73,222
SAMN02334986	newborn scale (Alligator sinensis, SAMN02334986)	53,333,334	56%	12%	110,941
SAMN02334987	testis (Alligator sinensis, SAMN02334987)	53,333,334	60%	12%	140,994
SAMN03081269	heart,lung,liver,kidney,brain,spleen (Crocodylus siamensis, not collected, not collected, SAMN03081269)	218,742,672	38%	7%	143,408
SAMN03246848	blood (Crocodylus niloticus, not collected, SAMN03246848)	29,126,382	73%	16%	107,546
SAMN04528910	belly skin (Alligator mississippiensis, not determined, SAMN04528910)	8,624,718	55%	15%	81,024
SAMN04528911	cerebellum (Alligator mississippiensis, not determined, SAMN04528911)	4,615,534	68%	10%	93,815
SAMN04528912	chin glands (Alligator mississippiensis, not determined, SAMN04528912)	2,640,112	53%	11%	58,545
SAMN04528913	eye (Alligator mississippiensis, not determined, SAMN04528913)	3,056,172	69%	11%	80,654
SAMN04528914	heart (Alligator mississippiensis, not determined, SAMN04528914)	6,082,134	43%	10%	63,141
SAMN04528915	kidney (Alligator mississippiensis, not determined, SAMN04528915)	4,803,332	62%	12%	86,182
SAMN04528916	liver (Alligator mississippiensis, not determined, SAMN04528916)	5,779,446	48%	11%	64,886
SAMN04528917	midbrain (Alligator mississippiensis, not determined, SAMN04528917)	4,712,508	66%	10%	95,337
SAMN04528918	olfactory bulb (Alligator mississippiensis, not determined, SAMN04528918)	6,558,974	66%	10%	104,829
SAMN04528919	ovary (Alligator mississippiensis, female, SAMN04528919)	7,545,902	71%	17%	105,249
SAMN04528920	spinal cord (Alligator mississippiensis, not determined, SAMN04528920)	5,793,968	65%	10%	96,732
SAMN04528921	spleen (Alligator mississippiensis, not determined, SAMN04528921)	3,249,278	59%	12%	48,074
SAMN04528922	stomach (Alligator mississippiensis, not determined, SAMN04528922)	990,312	37%	7%	24,302
SAMN04528923	testis (Alligator mississippiensis, male, SAMN04528923)	6,279,394	59%	12%	104,645
SAMN04528924	thalamus (Alligator mississippiensis, not determined, SAMN04528924)	5,753,500	65%	10%	100,352
SAMN04528925	throat scent gland (Alligator mississippiensis, not determined, SAMN04528925)	4,693,432	64%	13%	86,161
SAMN04528926	tongue (Alligator mississippiensis, not determined, SAMN04528926)	3,601,902	63%	12%	76,408
SAMN04528927	tooth (Alligator mississippiensis, not determined, SAMN04528927)	2,080,396	31%	6%	38,283
SAMN04528930	Pooled: Intraceolomic fat body, scute muscle, trachea, cloacal gland and gastralia (Alligator mississippiensis, not determined, SAMN04528930)	10,091,866	57%	11%	121,284
SAMN05072527	adrenal (Alligator mississippiensis, not applicable, SAMN05072527)	84,314,574	60%	15%	166,377
SAMN05072529	adrenal (Alligator mississippiensis, not applicable, SAMN05072529)	122,195,248	53%	13%	168,027
SAMN05072531	adrenal (Alligator mississippiensis, not applicable, SAMN05072531)	51,073,418	60%	14%	151,586
SAMN05072532	adrenal (Alligator mississippiensis, female, SAMN05072532)	82,793,568	61%	14%	166,263
SAMN05072533	adrenal (Alligator mississippiensis, male, SAMN05072533)	69,909,146	54%	14%	141,698
SAMN05072536	adrenal (Alligator mississippiensis, female, SAMN05072536)	77,931,082	53%	13%	149,676
SAMN05072537	adrenal (Alligator mississippiensis, male, SAMN05072537)	76,033,458	51%	13%	128,004
SAMN05072540	adrenal (Alligator mississippiensis, female, SAMN05072540)	31,074,784	62%	14%	131,235
SAMN05072541	adrenal (Alligator mississippiensis, male, SAMN05072541)	34,051,110	60%	14%	128,847
SAMN05072542	adrenal (Alligator mississippiensis, female, SAMN05072542)	78,870,348	58%	15%	163,030
SAMN05072543	adrenal (Alligator mississippiensis, male, SAMN05072543)	73,778,216	62%	13%	149,095
SAMN05072546	adrenal (Alligator mississippiensis, female, SAMN05072546)	86,820,312	56%	10%	142,612
SAMN05072547	adrenal (Alligator mississippiensis, male, SAMN05072547)	39,227,816	44%	8%	54,764
SAMN05072550	adrenal (Alligator mississippiensis, female, SAMN05072550)	53,922,930	39%	8%	97,158
SAMN05072551	adrenal (Alligator mississippiensis, male, SAMN05072551)	59,083,376	62%	13%	151,890
SAMN05072553	gonad (Alligator mississippiensis, not applicable, SAMN05072553)	61,491,696	69%	14%	169,180
SAMN05072554	gonad (Alligator mississippiensis, not applicable, SAMN05072554)	82,546,858	64%	16%	173,829
SAMN05072555	gonad (Alligator mississippiensis, not applicable, SAMN05072555)	71,511,350	56%	15%	132,357
SAMN05072556	gonad (Alligator mississippiensis, not applicable, SAMN05072556)	13,429,942	54%	11%	80,158
SAMN05072559	gonad (Alligator mississippiensis, female, SAMN05072559)	15,895,686	56%	11%	104,876
SAMN05072560	gonad (Alligator mississippiensis, male, SAMN05072560)	58,779,554	68%	14%	163,955
SAMN05072561	gonad (Alligator mississippiensis, female, SAMN05072561)	73,121,804	66%	16%	159,516
SAMN05072562	gonad (Alligator mississippiensis, male, SAMN05072562)	59,464,832	57%	13%	151,992
SAMN05072563	gonad (Alligator mississippiensis, female, SAMN05072563)	55,728,968	50%	14%	135,372
SAMN05072564	gonad (Alligator mississippiensis, male, SAMN05072564)	72,943,022	60%	16%	162,690
SAMN05072565	gonad (Alligator mississippiensis, female, SAMN05072565)	19,962,026	60%	12%	141,012
SAMN05072566	gonad (Alligator mississippiensis, male, SAMN05072566)	14,829,678	64%	13%	108,792
SAMN05072569	gonad (Alligator mississippiensis, female, SAMN05072569)	55,593,100	61%	13%	147,749
SAMN05072570	gonad (Alligator mississippiensis, male, SAMN05072570)	80,613,450	60%	13%	160,718
SAMN05072571	gonad (Alligator mississippiensis, female, SAMN05072571)	75,757,550	59%	13%	166,183
SAMN05072572	gonad (Alligator mississippiensis, male, SAMN05072572)	96,496,096	68%	17%	167,163
SAMN05072573	gonad (Alligator mississippiensis, female, SAMN05072573)	71,594,264	64%	14%	164,352
SAMN05072574	gonad (Alligator mississippiensis, male, SAMN05072574)	88,171,966	63%	16%	144,941
SAMN05072575	gonad (Alligator mississippiensis, female, SAMN05072575)	19,476,676	68%	14%	137,483
SAMN05072576	gonad (Alligator mississippiensis, male, SAMN05072576)	17,742,378	63%	14%	125,396
SAMN05072577	mesonephros (Alligator mississippiensis, not applicable, SAMN05072577)	90,842,680	57%	15%	157,968
SAMN05072578	mesonephros (Alligator mississippiensis, not applicable, SAMN05072578)	105,996,934	58%	13%	143,142
SAMN05072579	mesonephros (Alligator mississippiensis, not applicable, SAMN05072579)	98,862,710	54%	13%	159,605
SAMN05072580	mesonephros (Alligator mississippiensis, not applicable, SAMN05072580)	82,190,976	54%	14%	148,231
SAMN05072581	mesonephros (Alligator mississippiensis, not applicable, SAMN05072581)	68,049,006	56%	13%	138,063
SAMN05072582	mesonephros (Alligator mississippiensis, female, SAMN05072582)	77,388,244	59%	16%	161,517
SAMN05072583	mesonephros (Alligator mississippiensis, male, SAMN05072583)	71,870,742	60%	16%	147,852
SAMN05072584	mesonephros (Alligator mississippiensis, female, SAMN05072584)	73,983,190	58%	13%	146,555
SAMN05072585	mesonephros (Alligator mississippiensis, male, SAMN05072585)	53,105,426	55%	13%	110,419
SAMN05072586	mesonephros (Alligator mississippiensis, female, SAMN05072586)	77,580,598	49%	11%	111,780
SAMN05072587	mesonephros (Alligator mississippiensis, male, SAMN05072587)	105,192,670	56%	13%	159,967
SAMN05072588	mesonephros (Alligator mississippiensis, female, SAMN05072588)	69,254,180	49%	12%	93,405
SAMN05072589	mesonephros (Alligator mississippiensis, male, SAMN05072589)	78,786,302	59%	14%	151,109
SAMN05072590	mesonephros (Alligator mississippiensis, female, SAMN05072590)	44,533,870	59%	13%	145,095
SAMN05072591	mesonephros (Alligator mississippiensis, male, SAMN05072591)	61,484,048	53%	11%	121,335
SAMN05072592	mesonephros (Alligator mississippiensis, female, SAMN05072592)	86,296,438	49%	13%	123,632
SAMN05072593	mesonephros (Alligator mississippiensis, male, SAMN05072593)	81,763,736	63%	16%	167,900
SAMN05072594	mesonephros (Alligator mississippiensis, female, SAMN05072594)	77,538,118	48%	11%	111,834
SAMN05072595	mesonephros (Alligator mississippiensis, male, SAMN05072595)	62,416,656	56%	12%	141,395
SAMN05072596	mesonephros (Alligator mississippiensis, female, SAMN05072596)	57,819,366	46%	11%	100,885
SAMN05072597	mesonephros (Alligator mississippiensis, male, SAMN05072597)	59,207,280	42%	8%	78,412
SAMN05072598	mesonephros (Alligator mississippiensis, female, SAMN05072598)	91,293,082	55%	14%	160,932
SAMN05072599	mesonephros (Alligator mississippiensis, male, SAMN05072599)	89,990,182	59%	14%	165,204
SAMN05072600	mesonephros (Alligator mississippiensis, female, SAMN05072600)	52,435,730	46%	9%	97,675
SAMN05072601	mesonephros (Alligator mississippiensis, male, SAMN05072601)	60,880,586	51%	9%	83,634
SAMN05505094	Dental lamina Pre-initiation stage rep2 (Alligator mississippiensis, one year old, SAMN05505094)	38,638,147	61%	7%	116,497
SAMN05505095	Dental lamina Pre-initiation stage rep1 (Alligator mississippiensis, one year old, SAMN05505095)	31,499,845	58%	7%	127,932
SAMN05505096	Replacement tooth rep5 (Alligator mississippiensis, one year old, SAMN05505096)	32,902,957	60%	10%	128,199
SAMN05505097	Replacement tooth rep4 (Alligator mississippiensis, one year old, SAMN05505097)	41,159,868	63%	9%	138,512
SAMN05505098	Replacement tooth rep3 (Alligator mississippiensis, one year old, SAMN05505098)	38,255,443	62%	10%	134,058
SAMN05505099	Replacement tooth rep2 (Alligator mississippiensis, one year old, SAMN05505099)	29,233,761	67%	10%	130,384
SAMN05505100	Replacement tooth rep1 (Alligator mississippiensis, one year old, SAMN05505100)	42,231,003	67%	9%	138,200
SAMN05505101	Dental lamina Early Growth stage rep4 (Alligator mississippiensis, one year old, SAMN05505101)	42,936,625	67%	10%	144,268
SAMN05505102	Dental lamina Early Growth stage rep3 (Alligator mississippiensis, one year old, SAMN05505102)	41,712,358	67%	9%	143,808
SAMN05505103	Dental lamina Early Growth stage rep2 (Alligator mississippiensis, one year old, SAMN05505103)	34,775,422	68%	9%	138,790
SAMN05505104	Dental lamina Early Growth stage rep1 (Alligator mississippiensis, one year old, SAMN05505104)	25,237,995	68%	9%	129,590
SAMN05505105	Dental lamina Initiation stage rep3 (Alligator mississippiensis, one year old, SAMN05505105)	26,342,168	65%	8%	130,433
SAMN05505106	Dental lamina Initiation stage rep2 (Alligator mississippiensis, one year old, SAMN05505106)	28,412,102	63%	9%	130,769
SAMN05505107	Dental lamina Initiation stage rep1 (Alligator mississippiensis, one year old, SAMN05505107)	29,252,113	66%	9%	133,650
SAMN05505108	Dental lamina Pre-initiation stage rep5 (Alligator mississippiensis, one year old, SAMN05505108)	45,337,987	30%	3%	86,982
SAMN05505109	Dental lamina Pre-initiation stage rep4 (Alligator mississippiensis, one year old, SAMN05505109)	28,667,693	66%	8%	126,959
SAMN05505110	Dental lamina Pre-initiation stage rep3 (Alligator mississippiensis, one year old, SAMN05505110)	14,068,719	52%	6%	103,855

Show alignments statistics, by run (ERR, SRR, DRR)

Run	Experiment	Project	Sample	Number of reads	Percent aligned reads	Percent spliced reads
DRR048611	DRX043894	DRP002806	SAMD00042712	31,575,424	70%	15%
DRR048609	DRX043892	DRP002806	SAMD00042713	20,513,146	68%	15%
DRR048610	DRX043893	DRP002806	SAMD00042714	20,073,180	69%	15%
DRR048612	DRX043895	DRP002806	SAMD00042715	13,558,860	74%	9%
DRR048613	DRX043896	DRP002806	SAMD00042716	10,020,234	69%	14%
DRR048614	DRX043897	DRP002806	SAMD00042717	27,213,920	71%	14%
DRR048615	DRX043898	DRP002806	SAMD00042718	60,858,148	73%	12%
DRR048616	DRX043899	DRP002806	SAMD00042719	14,779,790	75%	10%
DRR048617	DRX043900	DRP002806	SAMD00042720	23,428,614	69%	14%
DRR048618	DRX043901	DRP002806	SAMD00042721	12,902,240	69%	14%
DRR048619	DRX043902	DRP002806	SAMD00042722	30,416,044	68%	14%
DRR048620	DRX043903	DRP002806	SAMD00042723	19,526,008	67%	15%
DRR048621	DRX043904	DRP002806	SAMD00042724	14,165,432	68%	14%
DRR048622	DRX043905	DRP002806	SAMD00042725	15,468,758	68%	15%
DRR048623	DRX043906	DRP002806	SAMD00042726	42,108,266	66%	14%
DRR048624	DRX043907	DRP002806	SAMD00042727	22,338,950	68%	15%
DRR048625	DRX043908	DRP002806	SAMD00042728	29,981,026	69%	15%
DRR048626	DRX043909	DRP002806	SAMD00042729	39,568,942	69%	15%
DRR048627	DRX043910	DRP002806	SAMD00042730	21,456,980	68%	15%
DRR048628	DRX043911	DRP002806	SAMD00042731	32,216,966	69%	15%
DRR048629	DRX043912	DRP002806	SAMD00042732	77,090,342	67%	15%
DRR048630	DRX043913	DRP002806	SAMD00042733	27,339,788	68%	15%
DRR048631	DRX043914	DRP002806	SAMD00042734	24,687,890	68%	15%
DRR048632	DRX043915	DRP002806	SAMD00042735	33,282,638	70%	15%
DRR048633	DRX043916	DRP002806	SAMD00042736	27,624,696	69%	15%
DRR048634	DRX043917	DRP002806	SAMD00042737	22,097,744	68%	15%
DRR048635	DRX043918	DRP002806	SAMD00042738	23,668,002	69%	15%
DRR048636	DRX043919	DRP002806	SAMD00042739	12,400,268	68%	14%
SRR029332	SRX012365	SRP001355	SAMN00004621	438,029	74%	10%
SRR629636	SRX209114	SRP017457	SAMN01823432	72,260,274	60%	11%
SRR957511	SRX339836	SRP028869	SAMN02334983	53,333,334	25%	6%
SRR957512	SRX339837	SRP028869	SAMN02334984	53,333,334	70%	15%
SRR957513	SRX339838	SRP028869	SAMN02334985	53,333,334	47%	10%
SRR957514	SRX339839	SRP028869	SAMN02334986	53,333,334	56%	12%
SRR957515	SRX339840	SRP028869	SAMN02334987	53,333,334	60%	12%
SRR1612398	SRX732876	SRP048915	SAMN03081269	72,914,224	28%	5%
SRR1612399	SRX732876	SRP048915	SAMN03081269	72,914,224	28%	5%
SRR1693195	SRX793982	SRP050457	SAMN03246848	29,126,382	73%	16%
SRR1693772	SRX796489	SRP050575	SAMN03081269	72,914,224	57%	11%
SRR3208124	SRX1616862	SRP057608	SAMN04528910	8,624,718	55%	15%
SRR3208125	SRX1616863	SRP057608	SAMN04528911	4,615,534	68%	10%
SRR3208137	SRX1616874	SRP057608	SAMN04528912	2,640,112	53%	11%
SRR3208140	SRX1616877	SRP057608	SAMN04528913	3,056,172	69%	11%
SRR3208141	SRX1616878	SRP057608	SAMN04528914	6,082,134	43%	10%
SRR3208142	SRX1616879	SRP057608	SAMN04528915	4,803,332	62%	12%
SRR3208143	SRX1616880	SRP057608	SAMN04528916	5,779,446	48%	11%
SRR3208144	SRX1616881	SRP057608	SAMN04528917	4,712,508	66%	10%
SRR3208146	SRX1616882	SRP057608	SAMN04528918	6,558,974	66%	10%
SRR3208147	SRX1616883	SRP057608	SAMN04528919	7,545,902	71%	17%
SRR3208126	SRX1616864	SRP057608	SAMN04528920	5,793,968	65%	10%
SRR3208127	SRX1616865	SRP057608	SAMN04528921	3,249,278	59%	12%
SRR3208128	SRX1616866	SRP057608	SAMN04528922	990,312	37%	7%
SRR3208129	SRX1616867	SRP057608	SAMN04528923	6,279,394	59%	12%
SRR3208130	SRX1616868	SRP057608	SAMN04528924	5,753,500	65%	10%
SRR3208131	SRX1616869	SRP057608	SAMN04528925	4,693,432	64%	13%
SRR3208132	SRX1616870	SRP057608	SAMN04528926	3,601,902	63%	12%
SRR3208133	SRX1616871	SRP057608	SAMN04528927	2,080,396	31%	6%
SRR3208138	SRX1616875	SRP057608	SAMN04528930	10,091,866	57%	11%
SRR3593723	SRX1803191	SRP075819	SAMN05072527	84,314,574	60%	15%
SRR3593692	SRX1803160	SRP075819	SAMN05072529	122,195,248	53%	13%
SRR3593686	SRX1803154	SRP075819	SAMN05072531	51,073,418	60%	14%
SRR3593721	SRX1803189	SRP075819	SAMN05072532	82,793,568	61%	14%
SRR3593725	SRX1803193	SRP075819	SAMN05072533	69,909,146	54%	14%
SRR3593691	SRX1803159	SRP075819	SAMN05072536	77,931,082	53%	13%
SRR3593688	SRX1803156	SRP075819	SAMN05072537	76,033,458	51%	13%
SRR3593685	SRX1803153	SRP075819	SAMN05072540	31,074,784	62%	14%
SRR3593683	SRX1803151	SRP075819	SAMN05072541	34,051,110	60%	14%
SRR3593722	SRX1803190	SRP075819	SAMN05072542	78,870,348	58%	15%
SRR3593724	SRX1803192	SRP075819	SAMN05072543	73,778,216	62%	13%
SRR3593690	SRX1803158	SRP075819	SAMN05072546	86,820,312	56%	10%
SRR3593689	SRX1803157	SRP075819	SAMN05072547	39,227,816	44%	8%
SRR3593687	SRX1803155	SRP075819	SAMN05072550	53,922,930	39%	8%
SRR3593684	SRX1803152	SRP075819	SAMN05072551	59,083,376	62%	13%
SRR3593733	SRX1803201	SRP075819	SAMN05072553	61,491,696	69%	14%
SRR3593720	SRX1803188	SRP075819	SAMN05072554	82,546,858	64%	16%
SRR3593699	SRX1803167	SRP075819	SAMN05072555	71,511,350	56%	15%
SRR3593693	SRX1803161	SRP075819	SAMN05072556	13,429,942	54%	11%
SRR3593734	SRX1803202	SRP075819	SAMN05072559	15,895,686	56%	11%
SRR3593735	SRX1803203	SRP075819	SAMN05072560	58,779,554	68%	14%
SRR3593719	SRX1803187	SRP075819	SAMN05072561	73,121,804	66%	16%
SRR3593716	SRX1803184	SRP075819	SAMN05072562	59,464,832	57%	13%
SRR3593700	SRX1803168	SRP075819	SAMN05072563	55,728,968	50%	14%
SRR3593703	SRX1803171	SRP075819	SAMN05072564	72,943,022	60%	16%
SRR3593715	SRX1803183	SRP075819	SAMN05072565	19,962,026	60%	12%
SRR3593682	SRX1803150	SRP075819	SAMN05072566	14,829,678	64%	13%
SRR3593732	SRX1803200	SRP075819	SAMN05072569	55,593,100	61%	13%
SRR3593736	SRX1803204	SRP075819	SAMN05072570	80,613,450	60%	13%
SRR3593718	SRX1803186	SRP075819	SAMN05072571	75,757,550	59%	13%
SRR3593717	SRX1803185	SRP075819	SAMN05072572	96,496,096	68%	17%
SRR3593701	SRX1803169	SRP075819	SAMN05072573	71,594,264	64%	14%
SRR3593702	SRX1803170	SRP075819	SAMN05072574	88,171,966	63%	16%
SRR3593704	SRX1803172	SRP075819	SAMN05072575	19,476,676	68%	14%
SRR3593681	SRX1803149	SRP075819	SAMN05072576	17,742,378	63%	14%
SRR3593713	SRX1803181	SRP075819	SAMN05072577	90,842,680	57%	15%
SRR3593729	SRX1803197	SRP075819	SAMN05072578	105,996,934	58%	13%
SRR3593695	SRX1803163	SRP075819	SAMN05072579	98,862,710	54%	13%
SRR3593707	SRX1803175	SRP075819	SAMN05072580	82,190,976	54%	14%
SRR3593740	SRX1803208	SRP075819	SAMN05072581	68,049,006	56%	13%
SRR3593712	SRX1803180	SRP075819	SAMN05072582	77,388,244	59%	16%
SRR3593710	SRX1803178	SRP075819	SAMN05072583	71,870,742	60%	16%
SRR3593727	SRX1803195	SRP075819	SAMN05072584	73,983,190	58%	13%
SRR3593731	SRX1803199	SRP075819	SAMN05072585	53,105,426	55%	13%
SRR3593696	SRX1803164	SRP075819	SAMN05072586	77,580,598	49%	11%
SRR3593697	SRX1803165	SRP075819	SAMN05072587	105,192,670	56%	13%
SRR3593709	SRX1803177	SRP075819	SAMN05072588	69,254,180	49%	12%
SRR3593706	SRX1803174	SRP075819	SAMN05072589	78,786,302	59%	14%
SRR3593739	SRX1803207	SRP075819	SAMN05072590	44,533,870	59%	13%
SRR3593726	SRX1803194	SRP075819	SAMN05072591	61,484,048	53%	11%
SRR3593714	SRX1803182	SRP075819	SAMN05072592	86,296,438	49%	13%
SRR3593711	SRX1803179	SRP075819	SAMN05072593	81,763,736	63%	16%
SRR3593728	SRX1803196	SRP075819	SAMN05072594	77,538,118	48%	11%
SRR3593730	SRX1803198	SRP075819	SAMN05072595	62,416,656	56%	12%
SRR3593694	SRX1803162	SRP075819	SAMN05072596	57,819,366	46%	11%
SRR3593698	SRX1803166	SRP075819	SAMN05072597	59,207,280	42%	8%
SRR3593708	SRX1803176	SRP075819	SAMN05072598	91,293,082	55%	14%
SRR3593705	SRX1803173	SRP075819	SAMN05072599	89,990,182	59%	14%
SRR3593738	SRX1803206	SRP075819	SAMN05072600	52,435,730	46%	9%
SRR3593737	SRX1803205	SRP075819	SAMN05072601	60,880,586	51%	9%
SRR3993897	SRX1994978	SRP080802	SAMN05505094	38,638,147	61%	7%
SRR3993896	SRX1994977	SRP080802	SAMN05505095	31,499,845	58%	7%
SRR3993912	SRX1994993	SRP080802	SAMN05505096	32,902,957	60%	10%
SRR3993911	SRX1994992	SRP080802	SAMN05505097	41,159,868	63%	9%
SRR3993910	SRX1994991	SRP080802	SAMN05505098	38,255,443	62%	10%
SRR3993909	SRX1994990	SRP080802	SAMN05505099	29,233,761	67%	10%
SRR3993908	SRX1994989	SRP080802	SAMN05505100	42,231,003	67%	9%
SRR3993907	SRX1994988	SRP080802	SAMN05505101	42,936,625	67%	10%
SRR3993906	SRX1994987	SRP080802	SAMN05505102	41,712,358	67%	9%
SRR3993905	SRX1994986	SRP080802	SAMN05505103	34,775,422	68%	9%
SRR3993904	SRX1994985	SRP080802	SAMN05505104	25,237,995	68%	9%
SRR3993903	SRX1994984	SRP080802	SAMN05505105	26,342,168	65%	8%
SRR3993902	SRX1994983	SRP080802	SAMN05505106	28,412,102	63%	9%
SRR3993901	SRX1994982	SRP080802	SAMN05505107	29,252,113	66%	9%
SRR3993900	SRX1994981	SRP080802	SAMN05505108	45,337,987	30%	3%
SRR3993899	SRX1994980	SRP080802	SAMN05505109	28,667,693	66%	8%
SRR3993898	SRX1994979	SRP080802	SAMN05505110	14,068,719	52%	6%

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Sauropsida GenBank	19,663	16,215 (82.46%)	16,215 (82.46%)	70.81%	74.11%
Sauropsida known RefSeq (NP_)	8,083	7,607 (94.11%)	7,607 (94.11%)	74.28%	81.06%
Alligator mississippiensis high-quality model RefSeq (XP_)	13,803	12,879 (93.31%)	12,879 (93.31%)	78.21%	82.38%
Homo sapiens known RefSeq (NP_)	44,940	38,062 (84.70%)	38,062 (84.70%)	68.48%	72.03%

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20

RefSeq

Integrated reference sequences