NCBI Gossypium hirsutum Annotation Release 101

The RefSeq genome records for Gossypium hirsutum were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
BUSCO results: Annotation completeness assessed with BUSCO
Alignment of the annotated proteins to a set of high-quality proteins: The number of annotated proteins with hits to a set of high-quality proteins
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction
Similarity of current and previous assembly: The similarity of the current and previous assembly
Comparison of the current and previous annotations: What proportion of the genes changed in this annotation

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Gossypium hirsutum Annotation Release 101

Annotation release ID: 101
Date of Entrez queries for transcripts and proteins: Mar 25 2021
Date of submission of annotation to the public databases: Apr 25 2021
Software version: 8.6

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
Gossypium_hirsutum_v2.1	GCF_007990345.1	HudsonAlpha Genome Sequencing Center	02-25-2021	Reference	28 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	Gossypium_hirsutum_v2.1
Genes and pseudogenes	99,456
protein-coding	67,585
non-coding	24,917
Transcribed pseudogenes	93
Non-transcribed pseudogenes	6,860
genes with variants	23,073
Immunoglobulin/T-cell receptor gene segments	0
other	1
mRNAs	111,728
fully-supported	102,777
with > 5% ab initio	8,109
partial	369
with filled gap(s)	37
known RefSeq (NM_)	1,008
model RefSeq (XM_)	110,720
non-coding RNAs	43,817
fully-supported	29,608
with > 5% ab initio	0
partial	3
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	42,257
pseudo transcripts	93
fully-supported	87
with > 5% ab initio	0
partial	0
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	93
CDSs	111,844
fully-supported	102,777
with > 5% ab initio	8,268
partial	317
with major correction(s)	944
known RefSeq (NP_)	1,007
model RefSeq (XP_)	110,837

Detailed reports

The counts below do not include pseudogenes.

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	92,503	3,056	2,236	63	184,041
All transcripts	155,545	1,760	1,534	60	22,044
mRNA	111,728	1,963	1,692	102	22,044
misc_RNA	13,157	2,177	1,787	175	15,962
tRNA	1,548	74	73	60	93
lncRNA	16,459	1,444	1,070	69	16,039
snoRNA	10,996	107	107	64	225
snRNA	287	153	160	63	198
rRNA	1,370	552	119	103	3,559
Single-exon transcripts	10,701	1,311	1,119	252	9,268
coding transcripts (NM_/XM_ )	10,697	1,311	1,119	252	9,268
non-coding transcripts (NR_/XR_ )	4	1,648	2,259	658	2,467
CDSs	111,845	1,358	1,104	90	21,630
Exons	489,437	338	183	1	16,772
in coding transcripts (NM_/XM_ )	432,230	327	175	1	16,772
in non-coding transcripts (NR_/XR_ )	82,914	358	198	2	15,400
Introns	379,813	475	171	25	99,074
in coding transcripts (NM_/XM_ )	344,644	443	162	25	99,074
in non-coding transcripts (NR_/XR_ )	60,340	642	244	30	91,505

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	1.7	1	1	50
Number of exons per transcript	6.09	5	1	79

BUSCO analysis of gene annotation

BUSCO v4.0.2 (Simão et al 2015, PMID: 26059717) was run in "protein" mode on the annotated gene set picking one longest protein per gene, and run using the eudicots_odb10 lineage dataset. Results are reported for the gene set from the primary assembly unit, and presented in BUSCO notation (C:complete [S:single-copy, D:duplicated], F:fragmented, M:missing, n:number of genes used).

Alignment of the annotated proteins to a set of high-quality proteins

The final set of annotated proteins was searched with BLASTP against the Arabidopsis thaliana known RefSeq proteins, using the annotated proteins as the query and the high-quality proteins as the target. Out of 67468 coding genes, 60592 genes had a protein with an alignment covering 50% or more of the query and 30072 had an alignment covering 95% or more of the query.

Definition of query and target coverage. The query coverage is the percentage of the annotated protein length that is included in the alignment. The target coverage is the percentage of the target length that is included in the alignment.

Below is a cumulative graph displaying the number of genes with alignments above a given query or target coverage threshold. For comparison, corresponding statistics for other organisms annotated by the NCBI eukaryotic annotation pipeline were added to the graph.

Query: annotated proteins
Target: Arabidopsis thaliana known RefSeq proteins

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker for each assembly. RepeatMasker results are only used for organisms for which a comprehensive repeat library is available.

For this annotation run, transcripts and proteins were aligned to the genome masked with WindowMasker only.

Assembly name	Assembly accession	% Masked with RepeatMasker	% Masked with WindowMasker
Gossypium_hirsutum_v2.1	GCF_007990345.1		53.60%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign, minimap2, or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Transcript alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by Splign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Same-species known RefSeq (NM_/NR_)	1,015	1,015 (100.00%)	997 (98.23%)	99.64%	99.45%
Same-species Genbank	4,117	4,074 (98.96%)	3,715 (90.24%)	99.46%	99.07%
Same-species EST	337,796	298,288 (88.30%)	277,467 (82.14%)	99.28%	98.23%
Gossypium known RefSeq (NM_/NR_)	61	61 (100.00%)	56 (91.80%)	99.35%	99.15%
Gossypium Genbank	4,033	3,876 (96.11%)	3,338 (82.77%)	97.53%	97.29%

RefSeq transcript alignment quality report

The known RefSeq transcripts (NM_ and NR_ accessions) are a set of hiqh-quality transcripts maintained by the RefSeq group at NCBI. Alignment statistics for this group of transcripts, such as percent and number of sequences not aligning at all, percent best alignments split between multiple scaffolds, and percent alignments not covering the full CDS are indicative of the genome quality and are provided below.

	Gossypium_hirsutum_v2.1 Primary Assembly
Number of sequences retrieved from Entrez	1,015
Number (%) of sequences not aligning	0 (0.00%)
Number (%) of sequences with multiple best alignments (split genes)	0 (0.00%)
Number (%) of sequences with CDS coverage < 95%	5 (0.49%)

RNA-Seq alignments

The following RNA-Seq reads from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics, by sample (SAME, SAMN, SAMD, DRS)

Sample Id	Publication	Track name	Number of reads	Percent aligned reads	Percent of aligned reads with introns	Number of introns
All	NA	Aggregate of all aligned samples	9,355,219,097	87%	28%	470,918
SAMN02338737	NA	fibremax cultivar roots, control (Gossypium hirsutum, 40 days, SAMN02338737)	72,097,166	69%	18%	310,655
SAMN02338738	NA	fibremax cultivar roots, 50k nematodes (Gossypium hirsutum, 40 days, SAMN02338738)	70,930,938	65%	19%	309,496
SAMN02338741	NA	lonren cultivar roots, control (Gossypium hirsutum, 40 days, SAMN02338741)	61,353,774	79%	21%	207,693
SAMN02338742	NA	lonren cultivar roots, 5k nematodes (Gossypium hirsutum, 40 days, SAMN02338742)	24,862,664	71%	25%	305,789
SAMN02338743	NA	lonren cultivar roots, 10k nematodes (Gossypium hirsutum, 40 days, SAMN02338743)	25,244,064	70%	25%	298,880
SAMN02338744	NA	lonren cultivar roots, 50k nematodes (Gossypium hirsutum, 40 days, SAMN02338744)	27,159,642	75%	26%	309,408
SAMN02795971	25372034	floral buds, sterile line, sporogenous cells (Gossypium hirsutum, SAMN02795971)	66,695,222	93%	22%	350,854
SAMN02795972	25372034	floral buds, sterile line, microsporocyte (Gossypium hirsutum, SAMN02795972)	77,998,708	93%	22%	361,082
SAMN02795973	25372034	floral buds, fertile line, sporogenous cells (Gossypium hirsutum, SAMN02795973)	71,264,156	93%	22%	354,955
SAMN02795974	25372034	floral buds, fertile line, microsporocyte (Gossypium hirsutum, SAMN02795974)	62,779,022	94%	22%	353,116
SAMN03178187	NA	hypocotyl, cultivar T582 (Gossypium hirsutum, SAMN03178187)	46,300,996	90%	24%	333,303
SAMN03178263	NA	hypocotyl, cultivar TM-1 (Gossypium hirsutum, SAMN03178263)	47,101,026	90%	24%	336,732
SAMN03225203	NA	TM-1 0h seed (Gossypium hirsutum, SAMN03225203)	65,457,386	72%	19%	292,632
SAMN03225204	NA	TM-1 5h seed (Gossypium hirsutum, SAMN03225204)	54,796,192	74%	26%	306,923
SAMN03225205	NA	TM-1 10h seed (Gossypium hirsutum, SAMN03225205)	49,915,974	89%	22%	316,057
SAMN03225206	NA	TM-1 24h cotyledon (Gossypium hirsutum, SAMN03225206)	70,378,842	74%	26%	320,703
SAMN03225207	NA	TM-1 48h cotyledon (Gossypium hirsutum, SAMN03225207)	84,433,974	82%	25%	344,817
SAMN03225208	NA	TM-1 72h cotyledon (Gossypium hirsutum, SAMN03225208)	56,609,784	68%	17%	308,805
SAMN03225209	NA	TM-1 96h cotyledon (Gossypium hirsutum, SAMN03225209)	60,605,428	73%	17%	292,703
SAMN03225210	NA	TM-1 120h cotyledon (Gossypium hirsutum, SAMN03225210)	75,410,352	69%	19%	324,640
SAMN03225211	NA	TM-1 24h root (Gossypium hirsutum, SAMN03225211)	49,648,526	63%	25%	311,278
SAMN03225212	NA	TM-1 48h root (Gossypium hirsutum, SAMN03225212)	37,314,606	92%	26%	320,707
SAMN03225213	NA	TM-1 72h root (Gossypium hirsutum, SAMN03225213)	41,157,398	92%	25%	332,342
SAMN03225214	NA	TM-1 96h root (Gossypium hirsutum, SAMN03225214)	44,873,798	61%	23%	316,850
SAMN03225215	NA	TM-1 120h root (Gossypium hirsutum, SAMN03225215)	40,058,646	91%	24%	330,313
SAMN03225216	NA	TM-1 root (Gossypium hirsutum, SAMN03225216)	74,999,500	67%	23%	336,861
SAMN03225217	NA	TM-1 stem (Gossypium hirsutum, SAMN03225217)	24,222,900	87%	23%	288,251
SAMN03225218	NA	TM-1 leaf (Gossypium hirsutum, SAMN03225218)	22,872,944	91%	25%	306,791
SAMN03225219	NA	TM-1 torus (Gossypium hirsutum, SAMN03225219)	23,383,324	91%	24%	296,626
SAMN03225220	NA	TM-1 petal (Gossypium hirsutum, SAMN03225220)	24,652,508	92%	23%	259,063
SAMN03225221	NA	TM-1 stamen (Gossypium hirsutum, SAMN03225221)	19,631,596	91%	22%	246,621
SAMN03225222	NA	TM-1 pistil (Gossypium hirsutum, SAMN03225222)	24,663,350	91%	24%	312,876
SAMN03225223	NA	TM-1 calycle (Gossypium hirsutum, SAMN03225223)	76,651,700	63%	22%	310,791
SAMN03225224	NA	TM-1 -3dpa ovule (Gossypium hirsutum, SAMN03225224)	41,119,934	62%	21%	307,385
SAMN03225225	NA	TM-1 -1dpa ovule (Gossypium hirsutum, SAMN03225225)	49,517,460	69%	22%	311,348
SAMN03225226	NA	TM-1 0dpa ovule (Gossypium hirsutum, SAMN03225226)	66,716,694	69%	22%	325,597
SAMN03225227	NA	TM-1 1dpa ovule (Gossypium hirsutum, SAMN03225227)	72,211,042	69%	23%	330,066
SAMN03225228	NA	TM-1 3dpa ovule (Gossypium hirsutum, SAMN03225228)	94,494,300	79%	25%	345,556
SAMN03225229	NA	TM-1 5dpa ovule (Gossypium hirsutum, SAMN03225229)	21,030,506	92%	22%	270,202
SAMN03225230	NA	TM-1 10dpa ovule (Gossypium hirsutum, SAMN03225230)	21,340,700	91%	24%	294,202
SAMN03225231	NA	TM-1 20dpa ovule (Gossypium hirsutum, SAMN03225231)	52,704,074	62%	23%	325,404
SAMN03225232	NA	TM-1 25dpa ovule (Gossypium hirsutum, SAMN03225232)	26,310,166	62%	19%	269,515
SAMN03225233	NA	TM-1 35dpa ovule (Gossypium hirsutum, SAMN03225233)	41,331,736	63%	15%	265,910
SAMN03225234	NA	TM-1 5dpa fiber (Gossypium hirsutum, SAMN03225234)	78,099,374	65%	26%	321,829
SAMN03225235	NA	TM-1 10dpa fiber (Gossypium hirsutum, SAMN03225235)	57,360,958	62%	22%	293,608
SAMN03225236	NA	TM-1 20dpa fiber (Gossypium hirsutum, SAMN03225236)	36,656,408	75%	17%	267,457
SAMN03225237	NA	TM-1 25dpa fiber (Gossypium hirsutum, SAMN03225237)	63,248,372	79%	21%	330,456
SAMN03284726	NA	TM-1 leaf 1 h treated with cold (Gossypium hirsutum, SAMN03284726)	50,650,172	77%	34%	291,496
SAMN03284727	NA	TM-1 leaf 3 h treated with cold (Gossypium hirsutum, SAMN03284727)	49,253,932	65%	32%	285,594
SAMN03284728	NA	TM-1 leaf 6 h treated with cold (Gossypium hirsutum, SAMN03284728)	17,896,510	78%	26%	254,090
SAMN03284729	NA	TM-1 leaf 12 h treated with cold (Gossypium hirsutum, SAMN03284729)	43,852,532	66%	22%	261,016
SAMN03284730	NA	TM-1 leaf 1 h treated with hot (Gossypium hirsutum, SAMN03284730)	33,100,514	69%	16%	234,304
SAMN03284731	NA	TM-1 leaf 3 h treated with hot (Gossypium hirsutum, SAMN03284731)	33,205,590	78%	33%	286,072
SAMN03284732	NA	TM-1 leaf 6 h treated with hot (Gossypium hirsutum, SAMN03284732)	30,555,796	64%	29%	278,402
SAMN03284733	NA	TM-1 leaf 12 h treated with hot (Gossypium hirsutum, SAMN03284733)	29,115,826	80%	35%	306,044
SAMN03284734	NA	TM-1 leaf 1 h treated with salt (Gossypium hirsutum, SAMN03284734)	31,927,912	78%	36%	279,313
SAMN03284735	NA	TM-1 leaf 3 h treated with salt (Gossypium hirsutum, SAMN03284735)	53,232,076	79%	35%	300,048
SAMN03284736	NA	TM-1 leaf 6 h treated with salt (Gossypium hirsutum, SAMN03284736)	36,037,844	79%	30%	292,088
SAMN03284737	NA	TM-1 leaf 12 h treated with salt (Gossypium hirsutum, SAMN03284737)	35,648,600	80%	37%	320,200
SAMN03284738	NA	TM-1 leaf 1 h treated with PEG (Gossypium hirsutum, SAMN03284738)	54,989,656	66%	35%	285,758
SAMN03284739	NA	TM-1 leaf 3 h treated with PEG (Gossypium hirsutum, SAMN03284739)	39,437,564	75%	34%	277,305
SAMN03284740	NA	TM-1 leaf 6 h treated with PEG (Gossypium hirsutum, SAMN03284740)	43,771,772	76%	31%	297,972
SAMN03284741	NA	TM-1 leaf 12 h treated with PEG (Gossypium hirsutum, SAMN03284741)	52,057,828	74%	35%	308,262
SAMN03284742	NA	TM-1 leaf 0 h CK (Gossypium hirsutum, SAMN03284742)	16,001,054	40%	10%	129,311
SAMN03284743	NA	TM-1 leaf 1 h CK (Gossypium hirsutum, SAMN03284743)	46,925,084	74%	36%	292,716
SAMN03284744	NA	TM-1 leaf 3 h CK (Gossypium hirsutum, SAMN03284744)	23,030,828	71%	35%	254,121
SAMN03284745	NA	TM-1 leaf 6 h CK (Gossypium hirsutum, SAMN03284745)	23,037,946	77%	34%	274,086
SAMN03284746	NA	TM-1 leaf 12 h CK (Gossypium hirsutum, SAMN03284746)	36,220,182	72%	36%	299,153
SAMN03349301	NA	non-inoculated pericarp (Gossypium hirsutum, SAMN03349301)	163,090,907	93%	24%	362,223
SAMN03349304	NA	non-inoculated seed (Gossypium hirsutum, SAMN03349304)	193,242,949	93%	19%	365,554
SAMN03349305	NA	atoxigenic seed (Gossypium hirsutum, SAMN03349305)	137,348,154	91%	18%	358,166
SAMN03349306	NA	toxigenic seed (Gossypium hirsutum, SAMN03349306)	82,059,811	91%	20%	347,096
SAMN03800036	26892265	Cotyledon (Gossypium hirsutum, SAMN03800036)	53,395,072	94%	31%	337,573
SAMN03800037	26892265	Root (Gossypium hirsutum, SAMN03800037)	48,095,112	94%	31%	343,354
SAMN03800038	26892265	Stem (Gossypium hirsutum, SAMN03800038)	48,066,996	95%	31%	349,557
SAMN03800039	26892265	New leaf (Gossypium hirsutum, SAMN03800039)	47,422,104	94%	30%	349,977
SAMN03800040	26892265	Old leaf (Gossypium hirsutum, SAMN03800040)	43,184,942	93%	30%	313,114
SAMN03800041	26892265	Cotyledon (Gossypium hirsutum, SAMN03800041)	40,163,404	94%	29%	302,308
SAMN03800042	26892265	Stem (Gossypium hirsutum, SAMN03800042)	42,302,970	95%	31%	341,382
SAMN03800043	26892265	New leaves (Gossypium hirsutum, SAMN03800043)	47,224,072	94%	31%	355,822
SAMN03800044	26892265	Old leaves (Gossypium hirsutum, SAMN03800044)	53,359,718	94%	31%	320,548
SAMN03800045	26892265	Corollas (Gossypium hirsutum, SAMN03800045)	50,261,214	95%	29%	296,407
SAMN03800046	26892265	Bracts (Gossypium hirsutum, SAMN03800046)	42,055,224	94%	29%	323,524
SAMN03800047	26892265	Calyxs (Gossypium hirsutum, SAMN03800047)	45,177,656	94%	30%	324,411
SAMN03800048	26892265	A & G (Gossypium hirsutum, SAMN03800048)	45,571,034	94%	28%	308,875
SAMN03800049	26892265	Ovule 0 dpa (Gossypium hirsutum, SAMN03800049)	44,186,650	94%	32%	341,308
SAMN03800050	26892265	Ovule 10 dpa (Gossypium hirsutum, SAMN03800050)	40,688,626	95%	31%	325,039
SAMN03800051	26892265	Ovule 20 dpa (Gossypium hirsutum, SAMN03800051)	46,101,428	94%	31%	346,698
SAMN03800052	26892265	Ovule 30 dpa (Gossypium hirsutum, SAMN03800052)	46,301,958	94%	25%	319,508
SAMN03800053	26892265	Ovule 40 dpa (Gossypium hirsutum, SAMN03800053)	48,364,018	95%	23%	312,103
SAMN03800054	26892265	Fiber 10 dpa (Gossypium hirsutum, SAMN03800054)	48,125,488	95%	30%	305,851
SAMN03800055	26892265	Fiber 20 dpa (Gossypium hirsutum, SAMN03800055)	45,365,444	94%	25%	286,661
SAMN03800056	26892265	Boll-shell 10 dpa (Gossypium hirsutum, SAMN03800056)	48,930,544	95%	30%	332,134
SAMN05393171	NA	flower bud (Gossypium hirsutum, 3 months, SAMN05393171)	8,690,670	92%	37%	260,342
SAMN05393746	NA	flower bud (Gossypium hirsutum, 3 months, SAMN05393746)	4,310,358	89%	24%	159,465
SAMN05394001	NA	flower bud (Gossypium hirsutum, 3 months, SAMN05394001)	6,125,462	92%	37%	216,610
SAMN05394803	NA	flower bud (Gossypium hirsutum, 3 months, SAMN05394803)	8,609,774	87%	19%	210,186
SAMN06818720	NA	Buds (Gossypium hirsutum, SAMN06818720)	30,549,142	76%	37%	274,252
SAMN06818721	NA	bud (Gossypium hirsutum, SAMN06818721)	22,499,360	77%	38%	249,611
SAMN06818722	NA	bud (Gossypium hirsutum, SAMN06818722)	26,405,308	80%	39%	278,439
SAMN06818723	NA	bud (Gossypium hirsutum, SAMN06818723)	55,457,430	79%	39%	300,402
SAMN06818724	NA	bud (Gossypium hirsutum, SAMN06818724)	35,260,997	82%	40%	297,687
SAMN06818725	NA	bud (Gossypium hirsutum, SAMN06818725)	26,318,738	79%	40%	270,602
SAMN08054958	29650157	seed (Gossypium hirsutum, 10 dpa, SAMN08054958)	30,518,774	90%	26%	279,277
SAMN08054959	29650157	seed (Gossypium hirsutum, 20 dpa, SAMN08054959)	31,966,166	92%	32%	318,582
SAMN08054960	29650157	seed (Gossypium hirsutum, 30 dpa, SAMN08054960)	32,428,802	93%	25%	275,022
SAMN08054961	29650157	seed (Gossypium hirsutum, 10 dpa, SAMN08054961)	28,205,316	89%	27%	283,942
SAMN08054962	29650157	seed (Gossypium hirsutum, 20 dpa, SAMN08054962)	29,133,414	93%	30%	306,801
SAMN08054963	29650157	seed (Gossypium hirsutum, 30 dpa, SAMN08054963)	30,933,024	93%	23%	254,066
SAMN08054964	29650157	seed (Gossypium hirsutum, 10 dpa, SAMN08054964)	26,648,586	92%	28%	273,227
SAMN08054965	29650157	seed (Gossypium hirsutum, 20 dpa, SAMN08054965)	31,435,168	93%	31%	308,803
SAMN08054966	29650157	seed (Gossypium hirsutum, 30 dpa, SAMN08054966)	30,362,796	94%	21%	243,942
SAMN08391524	NA	bud (Gossypium hirsutum, immature, collected at end of day, SAMN08391524)	69,504,542	90%	24%	360,943
SAMN08391525	NA	bud (Gossypium hirsutum, immature, collected at end of night, SAMN08391525)	65,791,612	93%	24%	359,831
SAMN08391526	NA	meristem (Gossypium hirsutum, na, collected at end of day, SAMN08391526)	67,276,668	91%	24%	348,302
SAMN08391527	NA	meristem (Gossypium hirsutum, na, collected at end of night, SAMN08391527)	66,199,456	92%	24%	351,057
SAMN08391528	NA	flower (Gossypium hirsutum, na, collected at end of day, SAMN08391528)	61,675,172	94%	24%	363,739
SAMN08391529	NA	leaf (Gossypium hirsutum, mature, collected at end of day, SAMN08391529)	136,512,162	92%	25%	333,981
SAMN08391530	NA	leaf (Gossypium hirsutum, mature, collected at end of night, SAMN08391530)	78,726,188	90%	26%	321,868
SAMN08391531	NA	leaf (Gossypium hirsutum, immature, collected at end of day, SAMN08391531)	62,964,186	91%	23%	306,834
SAMN08391532	NA	leaf (Gossypium hirsutum, immature, collected at end of night, SAMN08391532)	90,401,304	92%	25%	359,211
SAMN13684515	NA	shoot apical (Gossypium hirsutum, SAMN13684515)	52,950,162	94%	35%	359,607
SAMN13684516	NA	shoot apical (Gossypium hirsutum, SAMN13684516)	61,281,984	94%	35%	364,870
SAMN13684517	NA	shoot apical (Gossypium hirsutum, SAMN13684517)	46,795,884	93%	34%	352,682
SAMN13684518	NA	shoot apical (Gossypium hirsutum, SAMN13684518)	55,100,216	93%	35%	363,032
SAMN13684519	NA	shoot apical (Gossypium hirsutum, SAMN13684519)	44,202,366	94%	36%	352,138
SAMN13684520	NA	shoot apical (Gossypium hirsutum, SAMN13684520)	55,693,718	94%	36%	360,601
SAMN13684521	NA	shoot apical (Gossypium hirsutum, SAMN13684521)	44,490,144	93%	35%	350,664
SAMN13684522	NA	shoot apical (Gossypium hirsutum, SAMN13684522)	48,221,980	94%	37%	359,286
SAMN13684523	NA	shoot apical (Gossypium hirsutum, SAMN13684523)	49,727,930	94%	35%	356,081
SAMN13684524	NA	shoot apical (Gossypium hirsutum, SAMN13684524)	65,018,562	94%	35%	365,628
SAMN13684525	NA	shoot apical (Gossypium hirsutum, SAMN13684525)	49,390,176	94%	35%	357,030
SAMN13684526	NA	shoot apical (Gossypium hirsutum, SAMN13684526)	53,559,252	93%	35%	355,552
SAMN13684527	NA	shoot apical (Gossypium hirsutum, SAMN13684527)	52,290,294	94%	35%	356,088
SAMN13684528	NA	shoot apical (Gossypium hirsutum, SAMN13684528)	52,535,052	94%	35%	356,978
SAMN13684529	NA	shoot apical (Gossypium hirsutum, SAMN13684529)	53,903,040	93%	33%	353,633
SAMN13684530	NA	shoot apical (Gossypium hirsutum, SAMN13684530)	50,270,196	93%	34%	351,255
SAMN13918659	NA	meristem (Gossypium hirsutum, SAMN13918659)	20,052,118	92%	23%	305,272
SAMN13918660	NA	meristem (Gossypium hirsutum, SAMN13918660)	29,253,245	91%	17%	295,829
SAMN13918661	NA	meristem (Gossypium hirsutum, SAMN13918661)	14,386,553	91%	22%	298,627
SAMN13918662	NA	square (Gossypium hirsutum, SAMN13918662)	27,075,888	92%	22%	326,295
SAMN13918663	NA	square (Gossypium hirsutum, SAMN13918663)	11,753,798	93%	19%	274,963
SAMN13918664	NA	square (Gossypium hirsutum, SAMN13918664)	23,362,615	93%	22%	307,437
SAMN13918665	NA	3days post square (Gossypium hirsutum, SAMN13918665)	13,963,087	93%	23%	305,210
SAMN13918666	NA	3days post square (Gossypium hirsutum, SAMN13918666)	17,199,383	93%	21%	304,227
SAMN13918667	NA	3days post square (Gossypium hirsutum, SAMN13918667)	20,129,867	93%	18%	304,165
SAMN13918668	NA	6days post square (Gossypium hirsutum, SAMN13918668)	16,923,674	93%	20%	288,055
SAMN13918669	NA	6days post square (Gossypium hirsutum, SAMN13918669)	16,723,928	94%	23%	295,981
SAMN13918670	NA	6days post square (Gossypium hirsutum, SAMN13918670)	11,385,784	94%	21%	271,607
SAMN13918671	NA	-14 days post anthesis bud (Gossypium hirsutum, SAMN13918671)	15,526,183	95%	24%	304,157
SAMN13918672	NA	-14 days post anthesis bud (Gossypium hirsutum, SAMN13918672)	16,579,279	94%	23%	282,286
SAMN13918673	NA	-14 days post anthesis bud (Gossypium hirsutum, SAMN13918673)	9,026,489	94%	24%	282,307
SAMN13918674	NA	-9 days post anthesis bud (Gossypium hirsutum, SAMN13918674)	16,883,120	94%	24%	318,652
SAMN13918675	NA	-9 days post anthesis bud (Gossypium hirsutum, SAMN13918675)	16,934,483	95%	24%	306,359
SAMN13918676	NA	-9 days post anthesis bud (Gossypium hirsutum, SAMN13918676)	13,050,621	94%	25%	306,263
SAMN13918677	NA	-4 days post anthesis bud (Gossypium hirsutum, SAMN13918677)	13,569,871	95%	25%	298,597
SAMN13918678	NA	-4 days post anthesis bud (Gossypium hirsutum, SAMN13918678)	10,160,529	95%	21%	241,008
SAMN13918679	NA	-4 days post anthesis bud (Gossypium hirsutum, SAMN13918679)	19,607,976	94%	24%	322,410
SAMN13918680	NA	flower 0 days post anthesis (Gossypium hirsutum, SAMN13918680)	15,640,561	94%	17%	188,768
SAMN13918681	NA	flower 0 days post anthesis (Gossypium hirsutum, SAMN13918681)	21,221,459	94%	22%	268,412
SAMN13918682	NA	flower 0 days post anthesis (Gossypium hirsutum, SAMN13918682)	14,213,411	94%	22%	233,465
SAMN13918683	NA	first leaf subtending Stage 1 (Gossypium hirsutum, SAMN13918683)	15,031,780	94%	23%	289,739
SAMN13918684	NA	first leaf subtending Stage 1 (Gossypium hirsutum, SAMN13918684)	34,648,437	94%	21%	320,654
SAMN13918685	NA	first leaf subtending Stage 1 (Gossypium hirsutum, SAMN13918685)	26,751,213	93%	19%	309,602
SAMN13918686	NA	second leaf subtending stage 1 (Gossypium hirsutum, SAMN13918686)	27,265,304	95%	24%	312,141
SAMN13918687	NA	second leaf subtending stage 1 (Gossypium hirsutum, SAMN13918687)	20,407,771	94%	24%	275,224
SAMN13918688	NA	second leaf subtending stage 1 (Gossypium hirsutum, SAMN13918688)	16,220,085	94%	22%	289,825
SAMN13918689	NA	third leaf subtending stage 1 (Gossypium hirsutum, SAMN13918689)	7,688,199	93%	23%	203,592
SAMN13918690	NA	third leaf subtending stage 1 (Gossypium hirsutum, SAMN13918690)	10,818,155	95%	24%	227,770
SAMN13918691	NA	third leaf subtending stage 1 (Gossypium hirsutum, SAMN13918691)	21,827,664	91%	18%	275,871
SAMN13918692	NA	meristem of nonflowering branch (Gossypium hirsutum, SAMN13918692)	13,529,333	91%	19%	258,911
SAMN13918693	NA	meristem of nonflowering branch (Gossypium hirsutum, SAMN13918693)	10,474,778	92%	22%	268,283
SAMN13918694	NA	meristem of nonflowering branch (Gossypium hirsutum, SAMN13918694)	5,457,105	82%	12%	145,209
SAMN13918695	NA	first leaf subtending stage 12 (Gossypium hirsutum, SAMN13918695)	17,973,279	87%	22%	211,584
SAMN13918696	NA	first leaf subtending stage 12 (Gossypium hirsutum, SAMN13918696)	16,500,118	95%	25%	282,765
SAMN13918697	NA	first leaf subtending stage 12 (Gossypium hirsutum, SAMN13918697)	14,467,950	94%	18%	244,209
SAMN15323723	NA	anther (Gossypium hirsutum, SAMN15323723)	50,962,200	92%	34%	359,954
SAMN15323724	NA	anther (Gossypium hirsutum, SAMN15323724)	51,371,980	92%	35%	360,697
SAMN15323725	NA	anther (Gossypium hirsutum, SAMN15323725)	48,880,124	92%	34%	354,025
SAMN15323726	NA	anther (Gossypium hirsutum, SAMN15323726)	49,024,804	92%	35%	355,723
SAMN15323727	NA	anther (Gossypium hirsutum, SAMN15323727)	51,187,708	92%	34%	356,695
SAMN15323728	NA	anther (Gossypium hirsutum, SAMN15323728)	48,366,102	93%	35%	356,340
SAMN15323729	NA	anther (Gossypium hirsutum, SAMN15323729)	53,667,322	92%	35%	361,466
SAMN15323730	NA	anther (Gossypium hirsutum, SAMN15323730)	53,917,728	92%	34%	364,108
SAMN15323731	NA	anther (Gossypium hirsutum, SAMN15323731)	53,038,118	93%	35%	361,818
SAMN15323732	NA	anther (Gossypium hirsutum, SAMN15323732)	52,049,582	93%	34%	352,356
SAMN15323733	NA	anther (Gossypium hirsutum, SAMN15323733)	45,779,852	92%	34%	350,462
SAMN15323734	NA	anther (Gossypium hirsutum, SAMN15323734)	42,250,212	92%	34%	348,602
SAMN15323735	NA	anther (Gossypium hirsutum, SAMN15323735)	50,332,744	93%	32%	354,227
SAMN15323736	NA	anther (Gossypium hirsutum, SAMN15323736)	51,875,938	92%	33%	353,165
SAMN15323737	NA	anther (Gossypium hirsutum, SAMN15323737)	57,254,106	92%	32%	356,672
SAMN15323738	NA	anther (Gossypium hirsutum, SAMN15323738)	48,798,612	92%	32%	354,029
SAMN15323739	NA	anther (Gossypium hirsutum, SAMN15323739)	47,393,106	93%	34%	353,227
SAMN15323740	NA	anther (Gossypium hirsutum, SAMN15323740)	58,407,052	93%	33%	360,358
SAMN15323741	NA	anther (Gossypium hirsutum, SAMN15323741)	51,749,496	94%	32%	349,794
SAMN15323742	NA	anther (Gossypium hirsutum, SAMN15323742)	55,158,922	93%	31%	347,372
SAMN15323743	NA	anther (Gossypium hirsutum, SAMN15323743)	51,505,330	93%	33%	342,045
SAMN15323744	NA	anther (Gossypium hirsutum, SAMN15323744)	47,707,720	93%	34%	326,329
SAMN15323745	NA	anther (Gossypium hirsutum, SAMN15323745)	45,236,178	93%	34%	325,316
SAMN15323746	NA	anther (Gossypium hirsutum, SAMN15323746)	47,099,600	93%	36%	332,966
SAMN16561200	NA	tissue sample (Gossypium hirsutum, SAMN16561200)	28,349,992	91%	33%	268,581
SAMN16561201	NA	tissue sample (Gossypium hirsutum, SAMN16561201)	26,991,052	90%	32%	253,705
SAMN16561202	NA	tissue sample (Gossypium hirsutum, SAMN16561202)	30,251,496	91%	33%	312,644
SAMN16561203	NA	tissue sample (Gossypium hirsutum, SAMN16561203)	23,023,326	91%	32%	285,663
SAMN16561204	NA	tissue sample (Gossypium hirsutum, SAMN16561204)	24,844,096	93%	35%	294,341
SAMN16561205	NA	tissue sample (Gossypium hirsutum, SAMN16561205)	27,739,412	92%	34%	309,225
SAMN16561206	NA	tissue sample (Gossypium hirsutum, SAMN16561206)	33,824,326	92%	34%	325,921
SAMN16561207	NA	tissue sample (Gossypium hirsutum, SAMN16561207)	24,684,966	93%	37%	322,957
SAMN16561208	NA	tissue sample (Gossypium hirsutum, SAMN16561208)	22,691,310	93%	33%	312,007
SAMN16561209	NA	tissue sample (Gossypium hirsutum, SAMN16561209)	24,340,332	93%	35%	317,923
SAMN16561210	NA	tissue sample (Gossypium hirsutum, SAMN16561210)	26,059,648	89%	34%	275,593
SAMN16561211	NA	tissue sample (Gossypium hirsutum, SAMN16561211)	27,504,248	89%	34%	279,288
SAMN16561212	NA	tissue sample (Gossypium hirsutum, SAMN16561212)	27,514,520	93%	33%	319,931
SAMN16561213	NA	tissue sample (Gossypium hirsutum, SAMN16561213)	22,582,956	92%	34%	308,379
SAMN17735949	NA	anther (Gossypium hirsutum, SAMN17735949)	350,073,714	93%	33%	409,822

Show alignments statistics, by run (ERR, SRR, DRR)

Run	Experiment	Project	Sample	Number of reads	Percent aligned reads	Percent of aligned reads with introns
SRR960252	SRX342048	SRP029380	SAMN02338737	32,089,000	70%	18%
SRR960254	SRX342048	SRP029380	SAMN02338737	40,008,166	69%	18%
SRR960260	SRX342065	SRP029380	SAMN02338738	32,810,062	66%	19%
SRR960261	SRX342065	SRP029380	SAMN02338738	38,120,876	64%	19%
SRR960417	SRX342212	SRP029380	SAMN02338741	27,436,904	78%	21%
SRR960418	SRX342212	SRP029380	SAMN02338741	33,916,870	81%	21%
SRR960420	SRX342213	SRP029380	SAMN02338742	6,903,762	42%	45%
SRR960421	SRX342215	SRP029380	SAMN02338742	17,958,902	82%	22%
SRR960422	SRX342216	SRP029380	SAMN02338743	7,102,184	33%	45%
SRR960424	SRX342218	SRP029380	SAMN02338743	18,141,880	84%	22%
SRR960429	SRX342221	SRP029380	SAMN02338744	8,363,802	45%	45%
SRR960430	SRX342222	SRP029380	SAMN02338744	18,795,840	88%	22%
SRR1299180	SRX547770	SRP042128	SAMN02795971	66,695,222	93%	22%
SRR1298775	SRX547777	SRP042128	SAMN02795972	77,998,708	93%	22%
SRR1298776	SRX547779	SRP042128	SAMN02795973	71,264,156	93%	22%
SRR1298777	SRX547781	SRP042128	SAMN02795974	62,779,022	94%	22%
SRR1695160	SRX797886	SRP044705	SAMN03225203	65,457,386	72%	19%
SRR1695161	SRX797887	SRP044705	SAMN03225204	54,796,192	74%	26%
SRR1695162	SRX797888	SRP044705	SAMN03225205	49,915,974	89%	22%
SRR1695163	SRX797889	SRP044705	SAMN03225206	70,378,842	74%	26%
SRR1695164	SRX797890	SRP044705	SAMN03225207	84,433,974	82%	25%
SRR1695165	SRX797891	SRP044705	SAMN03225208	56,609,784	68%	17%
SRR1695166	SRX797892	SRP044705	SAMN03225209	60,605,428	73%	17%
SRR1695167	SRX797893	SRP044705	SAMN03225210	75,410,352	69%	19%
SRR1695168	SRX797894	SRP044705	SAMN03225211	49,648,526	63%	25%
SRR1695169	SRX797895	SRP044705	SAMN03225212	37,314,606	92%	26%
SRR1695170	SRX797896	SRP044705	SAMN03225213	41,157,398	92%	25%
SRR1695171	SRX797897	SRP044705	SAMN03225214	44,873,798	61%	23%
SRR1695172	SRX797898	SRP044705	SAMN03225215	40,058,646	91%	24%
SRR1695173	SRX797899	SRP044705	SAMN03225216	74,999,500	67%	23%
SRR1695174	SRX797900	SRP044705	SAMN03225217	24,222,900	87%	23%
SRR1695175	SRX797901	SRP044705	SAMN03225218	22,872,944	91%	25%
SRR1695176	SRX797902	SRP044705	SAMN03225219	23,383,324	91%	24%
SRR1695177	SRX797903	SRP044705	SAMN03225220	24,652,508	92%	23%
SRR1695178	SRX797904	SRP044705	SAMN03225221	19,631,596	91%	22%
SRR1695179	SRX797905	SRP044705	SAMN03225222	24,663,350	91%	24%
SRR1695180	SRX797906	SRP044705	SAMN03225223	76,651,700	63%	22%
SRR1695181	SRX797907	SRP044705	SAMN03225224	41,119,934	62%	21%
SRR1695182	SRX797908	SRP044705	SAMN03225225	49,517,460	69%	22%
SRR1695183	SRX797909	SRP044705	SAMN03225226	66,716,694	69%	22%
SRR1695184	SRX797910	SRP044705	SAMN03225227	72,211,042	69%	23%
SRR1695185	SRX797911	SRP044705	SAMN03225228	94,494,300	79%	25%
SRR1695186	SRX797912	SRP044705	SAMN03225229	21,030,506	92%	22%
SRR1695187	SRX797913	SRP044705	SAMN03225230	21,340,700	91%	24%
SRR1695188	SRX797914	SRP044705	SAMN03225231	52,704,074	62%	23%
SRR1695189	SRX797915	SRP044705	SAMN03225232	26,310,166	62%	19%
SRR1695190	SRX797916	SRP044705	SAMN03225233	41,331,736	63%	15%
SRR1695191	SRX797917	SRP044705	SAMN03225234	78,099,374	65%	26%
SRR1695192	SRX797918	SRP044705	SAMN03225235	57,360,958	62%	22%
SRR1695193	SRX797919	SRP044705	SAMN03225236	36,656,408	75%	17%
SRR1695194	SRX797920	SRP044705	SAMN03225237	63,248,372	79%	21%
SRR1768504	SRX849541	SRP044705	SAMN03284726	50,650,172	77%	34%
SRR1768505	SRX849542	SRP044705	SAMN03284727	49,253,932	65%	32%
SRR1768506	SRX849543	SRP044705	SAMN03284728	17,896,510	78%	26%
SRR1768507	SRX849544	SRP044705	SAMN03284729	43,852,532	66%	22%
SRR1768508	SRX849545	SRP044705	SAMN03284730	33,100,514	69%	16%
SRR1768509	SRX849546	SRP044705	SAMN03284731	33,205,590	78%	33%
SRR1768510	SRX849547	SRP044705	SAMN03284732	30,555,796	64%	29%
SRR1768511	SRX849548	SRP044705	SAMN03284733	29,115,826	80%	35%
SRR1768512	SRX849549	SRP044705	SAMN03284734	31,927,912	78%	36%
SRR1768513	SRX849550	SRP044705	SAMN03284735	53,232,076	79%	35%
SRR1768514	SRX849551	SRP044705	SAMN03284736	36,037,844	79%	30%
SRR1768515	SRX849552	SRP044705	SAMN03284737	35,648,600	80%	37%
SRR1768516	SRX849553	SRP044705	SAMN03284738	54,989,656	66%	35%
SRR1768517	SRX849554	SRP044705	SAMN03284739	39,437,564	75%	34%
SRR1768518	SRX849555	SRP044705	SAMN03284740	43,771,772	76%	31%
SRR1768519	SRX849556	SRP044705	SAMN03284741	52,057,828	74%	35%
SRR1768520	SRX849557	SRP044705	SAMN03284742	16,001,054	40%	10%
SRR1768521	SRX849558	SRP044705	SAMN03284743	46,925,084	74%	36%
SRR1768522	SRX849559	SRP044705	SAMN03284744	23,030,828	71%	35%
SRR1768523	SRX849560	SRP044705	SAMN03284745	23,037,946	77%	34%
SRR1768524	SRX849561	SRP044705	SAMN03284746	36,220,182	72%	36%
SRR1652406	SRX759582	SRP049798	SAMN03178187	46,300,996	90%	24%
SRR1652486	SRX759636	SRP049806	SAMN03178263	47,101,026	90%	24%
SRR1805072	SRX878131	SRP055046	SAMN03349301	163,090,907	93%	24%
SRR1805338	SRX878309	SRP055046	SAMN03349304	193,242,949	93%	19%
SRR1805339	SRX878310	SRP055046	SAMN03349305	137,348,154	91%	18%
SRR1805340	SRX878311	SRP055046	SAMN03349306	82,059,811	91%	20%
SRR2081038	SRX1075616	SRP059947	SAMN03800036	53,395,072	94%	31%
SRR2081039	SRX1075617	SRP059947	SAMN03800037	48,095,112	94%	31%
SRR2081040	SRX1075618	SRP059947	SAMN03800038	48,066,996	95%	31%
SRR2081041	SRX1075619	SRP059947	SAMN03800039	47,422,104	94%	30%
SRR2081042	SRX1075620	SRP059947	SAMN03800040	43,184,942	93%	30%
SRR2081043	SRX1075621	SRP059947	SAMN03800041	40,163,404	94%	29%
SRR2081044	SRX1075622	SRP059947	SAMN03800042	42,302,970	95%	31%
SRR2081045	SRX1075623	SRP059947	SAMN03800043	47,224,072	94%	31%
SRR2081046	SRX1075624	SRP059947	SAMN03800044	53,359,718	94%	31%
SRR2081047	SRX1075625	SRP059947	SAMN03800045	50,261,214	95%	29%
SRR2081048	SRX1075626	SRP059947	SAMN03800046	42,055,224	94%	29%
SRR2081049	SRX1075627	SRP059947	SAMN03800047	45,177,656	94%	30%
SRR2081050	SRX1075628	SRP059947	SAMN03800048	45,571,034	94%	28%
SRR2081051	SRX1075629	SRP059947	SAMN03800049	44,186,650	94%	32%
SRR2081052	SRX1075630	SRP059947	SAMN03800050	40,688,626	95%	31%
SRR2081053	SRX1075631	SRP059947	SAMN03800051	46,101,428	94%	31%
SRR2081054	SRX1075632	SRP059947	SAMN03800052	46,301,958	94%	25%
SRR2081055	SRX1075633	SRP059947	SAMN03800053	48,364,018	95%	23%
SRR2081056	SRX1075634	SRP059947	SAMN03800054	48,125,488	95%	30%
SRR2081057	SRX1075635	SRP059947	SAMN03800055	45,365,444	94%	25%
SRR2081058	SRX1075636	SRP059947	SAMN03800056	48,930,544	95%	30%
SRR5076574	SRX2395525	SRP094551	SAMN05393171	4,672,892	91%	38%
SRR5076579	SRX2395530	SRP094551	SAMN05393171	4,017,778	92%	36%
SRR5076575	SRX2395526	SRP094551	SAMN05393746	4,310,358	89%	24%
SRR5076597	SRX2395548	SRP094551	SAMN05394001	6,125,462	92%	37%
SRR5076576	SRX2395527	SRP094551	SAMN05394803	3,590,686	88%	18%
SRR5076580	SRX2395531	SRP094551	SAMN05394803	5,019,088	87%	20%
SRR5483288	SRX2766636	SRP105327	SAMN06818720	30,549,142	76%	37%
SRR5485153	SRX2768350	SRP105327	SAMN06818721	22,499,360	77%	38%
SRR5487041	SRX2769942	SRP105327	SAMN06818722	26,405,308	80%	39%
SRR5485157	SRX2768354	SRP105327	SAMN06818723	26,217,688	77%	40%
SRR5487327	SRX2770228	SRP105327	SAMN06818723	29,239,742	80%	39%
SRR5488111	SRX2771010	SRP105327	SAMN06818724	35,260,997	82%	40%
SRR5512122	SRX2786091	SRP105327	SAMN06818725	26,318,738	79%	40%
SRR6509775	SRX3598071	SRP131251	SAMN08391524	69,504,542	90%	24%
SRR6509776	SRX3598070	SRP131251	SAMN08391525	65,791,612	93%	24%
SRR6509777	SRX3598069	SRP131251	SAMN08391526	67,276,668	91%	24%
SRR6509778	SRX3598068	SRP131251	SAMN08391527	66,199,456	92%	24%
SRR6509771	SRX3598075	SRP131251	SAMN08391528	61,675,172	94%	24%
SRR6509772	SRX3598074	SRP131251	SAMN08391529	136,512,162	92%	25%
SRR6509773	SRX3598073	SRP131251	SAMN08391530	78,726,188	90%	26%
SRR6509774	SRX3598072	SRP131251	SAMN08391531	62,964,186	91%	23%
SRR6509779	SRX3598067	SRP131251	SAMN08391532	90,401,304	92%	25%
SRR6667222	SRX3644089	SRP132060	SAMN08054958	30,518,774	90%	26%
SRR6667221	SRX3644090	SRP132060	SAMN08054959	31,966,166	92%	32%
SRR6667224	SRX3644087	SRP132060	SAMN08054960	32,428,802	93%	25%
SRR6667223	SRX3644088	SRP132060	SAMN08054961	28,205,316	89%	27%
SRR6667226	SRX3644085	SRP132060	SAMN08054962	29,133,414	93%	30%
SRR6667225	SRX3644086	SRP132060	SAMN08054963	30,933,024	93%	23%
SRR6667228	SRX3644083	SRP132060	SAMN08054964	26,648,586	92%	28%
SRR6667227	SRX3644084	SRP132060	SAMN08054965	31,435,168	93%	31%
SRR6667229	SRX3644082	SRP132060	SAMN08054966	30,362,796	94%	21%
SRR10770882	SRX7444800	SRP238880	SAMN13684515	52,950,162	94%	35%
SRR10770881	SRX7444799	SRP238880	SAMN13684516	61,281,984	94%	35%
SRR10770880	SRX7444798	SRP238880	SAMN13684517	46,795,884	93%	34%
SRR10770879	SRX7444797	SRP238880	SAMN13684518	55,100,216	93%	35%
SRR10770878	SRX7444796	SRP238880	SAMN13684519	44,202,366	94%	36%
SRR10770877	SRX7444795	SRP238880	SAMN13684520	55,693,718	94%	36%
SRR10770876	SRX7444794	SRP238880	SAMN13684521	44,490,144	93%	35%
SRR10770875	SRX7444793	SRP238880	SAMN13684522	48,221,980	94%	37%
SRR10770874	SRX7444792	SRP238880	SAMN13684523	49,727,930	94%	35%
SRR10770873	SRX7444791	SRP238880	SAMN13684524	65,018,562	94%	35%
SRR10770872	SRX7444790	SRP238880	SAMN13684525	49,390,176	94%	35%
SRR10770871	SRX7444789	SRP238880	SAMN13684526	53,559,252	93%	35%
SRR10770870	SRX7444788	SRP238880	SAMN13684527	52,290,294	94%	35%
SRR10770869	SRX7444787	SRP238880	SAMN13684528	52,535,052	94%	35%
SRR10770868	SRX7444786	SRP238880	SAMN13684529	53,903,040	93%	33%
SRR10770867	SRX7444785	SRP238880	SAMN13684530	50,270,196	93%	34%
SRR10962278	SRX7627890	SRP244691	SAMN13918659	20,052,118	92%	23%
SRR10962277	SRX7627891	SRP244691	SAMN13918660	29,253,245	91%	17%
SRR10962266	SRX7627902	SRP244691	SAMN13918661	14,386,553	91%	22%
SRR10962255	SRX7627913	SRP244691	SAMN13918662	27,075,888	92%	22%
SRR10962245	SRX7627923	SRP244691	SAMN13918663	11,753,798	93%	19%
SRR10962244	SRX7627924	SRP244691	SAMN13918664	23,362,615	93%	22%
SRR10962243	SRX7627925	SRP244691	SAMN13918665	13,963,087	93%	23%
SRR10962242	SRX7627926	SRP244691	SAMN13918666	17,199,383	93%	21%
SRR10962241	SRX7627927	SRP244691	SAMN13918667	20,129,867	93%	18%
SRR10962240	SRX7627928	SRP244691	SAMN13918668	16,923,674	93%	20%
SRR10962276	SRX7627892	SRP244691	SAMN13918669	16,723,928	94%	23%
SRR10962275	SRX7627893	SRP244691	SAMN13918670	11,385,784	94%	21%
SRR10962274	SRX7627894	SRP244691	SAMN13918671	15,526,183	95%	24%
SRR10962273	SRX7627895	SRP244691	SAMN13918672	16,579,279	94%	23%
SRR10962272	SRX7627896	SRP244691	SAMN13918673	9,026,489	94%	24%
SRR10962271	SRX7627897	SRP244691	SAMN13918674	16,883,120	94%	24%
SRR10962270	SRX7627898	SRP244691	SAMN13918675	16,934,483	95%	24%
SRR10962269	SRX7627899	SRP244691	SAMN13918676	13,050,621	94%	25%
SRR10962268	SRX7627900	SRP244691	SAMN13918677	13,569,871	95%	25%
SRR10962267	SRX7627901	SRP244691	SAMN13918678	10,160,529	95%	21%
SRR10962265	SRX7627903	SRP244691	SAMN13918679	19,607,976	94%	24%
SRR10962264	SRX7627904	SRP244691	SAMN13918680	15,640,561	94%	17%
SRR10962263	SRX7627905	SRP244691	SAMN13918681	21,221,459	94%	22%
SRR10962262	SRX7627906	SRP244691	SAMN13918682	14,213,411	94%	22%
SRR10962261	SRX7627907	SRP244691	SAMN13918683	15,031,780	94%	23%
SRR10962260	SRX7627908	SRP244691	SAMN13918684	34,648,437	94%	21%
SRR10962259	SRX7627909	SRP244691	SAMN13918685	26,751,213	93%	19%
SRR10962258	SRX7627910	SRP244691	SAMN13918686	27,265,304	95%	24%
SRR10962257	SRX7627911	SRP244691	SAMN13918687	20,407,771	94%	24%
SRR10962256	SRX7627912	SRP244691	SAMN13918688	16,220,085	94%	22%
SRR10962254	SRX7627914	SRP244691	SAMN13918689	7,688,199	93%	23%
SRR10962253	SRX7627915	SRP244691	SAMN13918690	10,818,155	95%	24%
SRR10962252	SRX7627916	SRP244691	SAMN13918691	21,827,664	91%	18%
SRR10962251	SRX7627917	SRP244691	SAMN13918692	13,529,333	91%	19%
SRR10962250	SRX7627918	SRP244691	SAMN13918693	10,474,778	92%	22%
SRR10962249	SRX7627919	SRP244691	SAMN13918694	5,457,105	82%	12%
SRR10962248	SRX7627920	SRP244691	SAMN13918695	17,973,279	87%	22%
SRR10962247	SRX7627921	SRP244691	SAMN13918696	16,500,118	95%	25%
SRR10962246	SRX7627922	SRP244691	SAMN13918697	14,467,950	94%	18%
SRR12065092	SRX8592917	SRP268226	SAMN15323723	50,962,200	92%	34%
SRR12065091	SRX8592918	SRP268226	SAMN15323724	51,371,980	92%	35%
SRR12065080	SRX8592929	SRP268226	SAMN15323725	48,880,124	92%	34%
SRR12065075	SRX8592934	SRP268226	SAMN15323726	49,024,804	92%	35%
SRR12065074	SRX8592935	SRP268226	SAMN15323727	51,187,708	92%	34%
SRR12065073	SRX8592936	SRP268226	SAMN15323728	48,366,102	93%	35%
SRR12065072	SRX8592937	SRP268226	SAMN15323729	53,667,322	92%	35%
SRR12065071	SRX8592938	SRP268226	SAMN15323730	53,917,728	92%	34%
SRR12065070	SRX8592939	SRP268226	SAMN15323731	53,038,118	93%	35%
SRR12065069	SRX8592940	SRP268226	SAMN15323732	52,049,582	93%	34%
SRR12065090	SRX8592919	SRP268226	SAMN15323733	45,779,852	92%	34%
SRR12065089	SRX8592920	SRP268226	SAMN15323734	42,250,212	92%	34%
SRR12065088	SRX8592921	SRP268226	SAMN15323735	50,332,744	93%	32%
SRR12065087	SRX8592922	SRP268226	SAMN15323736	51,875,938	92%	33%
SRR12065086	SRX8592923	SRP268226	SAMN15323737	57,254,106	92%	32%
SRR12065085	SRX8592924	SRP268226	SAMN15323738	48,798,612	92%	32%
SRR12065084	SRX8592925	SRP268226	SAMN15323739	47,393,106	93%	34%
SRR12065083	SRX8592926	SRP268226	SAMN15323740	58,407,052	93%	33%
SRR12065082	SRX8592927	SRP268226	SAMN15323741	51,749,496	94%	32%
SRR12065081	SRX8592928	SRP268226	SAMN15323742	55,158,922	93%	31%
SRR12065079	SRX8592930	SRP268226	SAMN15323743	51,505,330	93%	33%
SRR12065078	SRX8592931	SRP268226	SAMN15323744	47,707,720	93%	34%
SRR12065077	SRX8592932	SRP268226	SAMN15323745	45,236,178	93%	34%
SRR12065076	SRX8592933	SRP268226	SAMN15323746	47,099,600	93%	36%
SRR12904565	SRX9369435	SRP288705	SAMN16561200	28,349,992	91%	33%
SRR12904564	SRX9369436	SRP288705	SAMN16561201	26,991,052	90%	32%
SRR12904559	SRX9369441	SRP288705	SAMN16561202	30,251,496	91%	33%
SRR12904558	SRX9369442	SRP288705	SAMN16561203	23,023,326	91%	32%
SRR12904557	SRX9369443	SRP288705	SAMN16561204	24,844,096	93%	35%
SRR12904556	SRX9369444	SRP288705	SAMN16561205	27,739,412	92%	34%
SRR12904555	SRX9369445	SRP288705	SAMN16561206	33,824,326	92%	34%
SRR12904554	SRX9369446	SRP288705	SAMN16561207	24,684,966	93%	37%
SRR12904553	SRX9369447	SRP288705	SAMN16561208	22,691,310	93%	33%
SRR12904552	SRX9369448	SRP288705	SAMN16561209	24,340,332	93%	35%
SRR12904563	SRX9369437	SRP288705	SAMN16561210	26,059,648	89%	34%
SRR12904562	SRX9369438	SRP288705	SAMN16561211	27,504,248	89%	34%
SRR12904561	SRX9369439	SRP288705	SAMN16561212	27,514,520	93%	33%
SRR12904560	SRX9369440	SRP288705	SAMN16561213	22,582,956	92%	34%
SRR13644626	SRX10041815	SRP304943	SAMN17735949	38,617,678	93%	33%
SRR13644625	SRX10041816	SRP304943	SAMN17735949	50,051,686	93%	32%
SRR13644624	SRX10041817	SRP304943	SAMN17735949	41,917,716	93%	33%
SRR13644623	SRX10041818	SRP304943	SAMN17735949	44,338,410	93%	33%
SRR13644622	SRX10041819	SRP304943	SAMN17735949	38,553,746	93%	31%
SRR13644621	SRX10041820	SRP304943	SAMN17735949	43,382,668	93%	33%
SRR13644620	SRX10041821	SRP304943	SAMN17735949	42,930,900	93%	33%
SRR13644619	SRX10041822	SRP304943	SAMN17735949	50,280,910	93%	33%

SRA Long Read Alignment Statistics

The following long read RNA-Seq reads (PacBio, Oxford Nanopore, 454, or other long-read sequencing technologies) from the Sequence Read Archive were also used for gene prediction:

Run	Sample	Number of reads	Number (%) of sequences aligned by Minimap2	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
All	NA	110061733	107886960 (98.02%)	83238852 (75.62%)	92.32	94.53
SRR032367	SAMN00007146	1138316	957362 (84.10%)	786490 (69.09%)	99.32	98.25
SRR032368	SAMN00007147	1050476	1013927 (96.52%)	913777 (86.98%)	99.12	98.65
SRR13857252	SAMN18138717	6296224	6281680 (99.76%)	4984427 (79.16%)	91.87	96.27
SRR13857253	SAMN18138716	5690484	5687399 (99.94%)	4526450 (79.54%)	91.87	96.32
SRR13857254	SAMN18138715	6528872	6524403 (99.93%)	5207517 (79.76%)	91.85	96.22
SRR13857255	SAMN18138718	7545051	7542844 (99.97%)	6197952 (82.14%)	92.46	96.02
SRR13857256	SAMN18138714	5693959	5683567 (99.81%)	4634375 (81.39%)	91.82	96.24
SRR13857257	SAMN18138713	6380621	6367506 (99.79%)	5243149 (82.17%)	91.83	96.17
SRR13857258	SAMN18138712	5450625	5438714 (99.78%)	4414357 (80.98%)	91.8	96.25
SRR13857261	SAMN18138717	5582299	5580499 (99.96%)	4503412 (80.67%)	91.88	95.81
SRR13857262	SAMN18138711	6761816	6753028 (99.87%)	5567602 (82.33%)	91.79	96.1
SRR13857272	SAMN18138720	6642112	6640082 (99.96%)	5436665 (81.85%)	92.44	96.07
SRR13857273	SAMN18138719	7269454	7266994 (99.96%)	6031324 (82.96%)	92.47	96.02
SRR13857274	SAMN18138710	6743250	6741087 (99.96%)	5468298 (81.09%)	91.74	96.13
SRR13857275	SAMN18138709	5796611	5791367 (99.90%)	4747169 (81.89%)	91.81	95.83
SRR398008	SAMN00771385	676569	630941 (93.25%)	489902 (72.40%)	99.18	99.17
SRR398009	SAMN00771386	704187	665614 (94.52%)	499746 (70.96%)	99.29	99.25
SRR398010	SAMN00771387	726225	686449 (94.52%)	535093 (73.68%)	99.29	99.26
SRR398011	SAMN00771388	894884	855347 (95.58%)	712422 (79.61%)	99.24	99.44
SRR398012	SAMN00771389	795441	749745 (94.25%)	601557 (75.62%)	99.25	99.38
SRR633517	SAMN01831345	488135	452696 (92.73%)	363773 (74.52%)	98.99	98.65
SRR633518	SAMN01831345	547947	504281 (92.03%)	386052 (70.45%)	99	98.61
SRR8073877	SAMN10255225	5371007	5079472 (94.57%)	2865392 (53.34%)	87.9	84.11
SRR8073884	SAMN10255238	1843977	1664394 (90.26%)	666579 (36.14%)	87.35	84.91
SRR8163085	SAMN10374819	47857	44919 (93.86%)	28444 (59.43%)	96.34	89.17
SRR8163086	SAMN10374819	63396	58427 (92.16%)	41519 (65.49%)	98.23	91.66
SRR8163087	SAMN10374819	62919	58567 (93.08%)	47528 (75.53%)	98.31	82.78
SRR8163088	SAMN10374819	68566	63401 (92.46%)	49356 (71.98%)	97.77	92.06
SRR8163089	SAMN10374819	31430	29620 (94.24%)	22434 (71.37%)	96.83	91.5
SRR8163090	SAMN10374819	32020	30507 (95.27%)	23200 (72.45%)	96.6	91.17
SRR8163091	SAMN10374819	32372	30702 (94.84%)	22523 (69.57%)	96.64	90.23
SRR8163092	SAMN10374819	64468	60332 (93.58%)	50835 (78.85%)	98.77	93.87
SRR8163093	SAMN10374819	47020	41053 (87.30%)	13681 (29.09%)	93.01	91.48
SRR8163094	SAMN10374819	42141	39307 (93.27%)	26632 (63.19%)	97.31	90.7
SRR8163100	SAMN10374819	52197	48886 (93.65%)	26870 (51.47%)	94.47	90.95
SRR8163101	SAMN10374819	50188	47031 (93.70%)	25768 (51.34%)	94.55	91.18
SRR8163104	SAMN10374819	64647	59986 (92.79%)	43663 (67.54%)	98.34	91.95
SRR8163105	SAMN10374819	65879	62206 (94.42%)	36620 (55.58%)	96.5	94.44
SRR8163106	SAMN10374819	70906	67407 (95.06%)	42090 (59.36%)	96.76	94.42
SRR8163107	SAMN10374819	71000	66331 (93.42%)	39993 (56.32%)	96.76	94.55
SRR8182568	SAMN10345425	12576185	11518880 (91.59%)	6914216 (54.97%)	89.03	81.84

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Vitis vinifera GenBank	1,490	916 (61.48%)	916 (61.48%)	72.61%	89.84%
Vitis vinifera high-quality model RefSeq (XP_)	21,011	19,314 (91.92%)	19,314 (91.92%)	69.94%	81.88%
Vitis vinifera known RefSeq (NP_)	393	378 (96.18%)	378 (96.18%)	70.87%	85.20%
Gossypium GenBank	527	377 (71.54%)	377 (71.54%)	78.97%	90.08%
Gossypium known RefSeq (NP_)	61	52 (85.25%)	52 (85.25%)	79.77%	90.22%
Same-species GenBank	2,328	1,156 (49.66%)	1,156 (49.66%)	80.43%	89.11%
Same-species known RefSeq (NP_)	1,015	1,001 (98.62%)	1,001 (98.62%)	79.13%	88.44%
Arabidopsis thaliana known RefSeq (NP_)	48,147	35,662 (74.07%)	35,662 (74.07%)	68.63%	77.84%
Oryza sativa GenBank	20,713	13,463 (65.00%)	13,463 (65.00%)	69.42%	77.41%
Oryza sativa high-quality model RefSeq (XP_)	26,045	12,660 (48.61%)	12,660 (48.61%)	66.05%	70.01%

Assembly-assembly alignments of current to previous assembly

When the assembly changes between two rounds of annotation, genes in the current and the previous annotation are mapped to each other using the genomic alignments of the current assembly to the previous assembly so that gene identifiers can be preserved. The success of the remapping depends largely on how well the two assembly versions align to each other.

Below are the percent coverage of one assembly by the other and the average percent identity of the alignments. The 'First pass' alignments are reciprocal best hits, while the 'Total' alignments also include 'Second pass' or non-reciprocal best alignments. For more information about the assembly-assembly alignment process, please visit the NCBI Genome Remapping Service page.

First Pass	Total
Gossypium_hirsutum_v2.1 (Current) Coverage: 83.46%	Gossypium_hirsutum_v2.1 (Current) Coverage: 89.50%
LBLM01 (Previous) Coverage: 90.37%	LBLM01 (Previous) Coverage: 94.88%
Percent Identity: 99.70%	Percent Identity: 99.18%

Comparison of the current and previous annotations

The annotation produced for this release (101) was compared to the annotation in the previous release (100) for each assembly annotated in both releases. Scores for current and previous gene and transcript features were calculated based on overlap in exon sequence and matches in exon boundaries. Pairs of current and previous features were categorized based on these scores, whether they are reciprocal best matches, and changes in attributes (gene biotype, completeness, etc.). If the assembly was updated between the two releases, alignments between the current and the previous assembly were used to match the current and previous gene and transcript features in mapped regions.

The table below summarizes the changes in the gene set for each assembly as a percent of the number of genes in the current annotation release, and provides links to the details of the comparison in tabular format and in a Genome Workbench project.

	Gossypium_hirsutum_v2.1 (Current) to ASM98774v1 (Previous)
Identical	6%
Minor changes	51%
Major changes	10%
New	30%
Deprecated	9%
Other	3%
Download the report	tabular, Genome Workbench

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20
Minimap2: Li H. Bioinformatics 2018 Sep 15;34(18):3094-3100

RefSeq

Integrated reference sequences