NCBI Camellia sinensis Annotation Release 100

The RefSeq genome records for Camellia sinensis were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
Alignment of the annotated proteins to a set of high-quality proteins: The number of annotated proteins with hits to a set of high-quality proteins
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Camellia sinensis Annotation Release 100

Annotation release ID: 100
Date of Entrez queries for transcripts and proteins: Feb 26 2019
Date of submission of annotation to the public databases: Mar 5 2019
Software version: 8.1

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
AHAU_CSS_1	GCF_004153795.1	Anhui Agricultural University	02-11-2019	Reference	1 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	AHAU_CSS_1
Genes and pseudogenes	68,531
protein-coding	50,838
non-coding	11,498
transcribed pseudogenes	17
non-transcribed pseudogenes	6,178
genes with variants	14,005
immunoglobulin/T-cell receptor gene segments	0
other	0
mRNAs	76,611
fully-supported	59,348
with > 5% ab initio	15,350
partial	3,467
with filled gap(s)	2,720
known RefSeq (NM_)	0
model RefSeq (XM_)	76,611
non-coding RNAs	25,175
fully-supported	23,181
with > 5% ab initio	0
partial	75
with filled gap(s)	75
known RefSeq (NR_)	0
model RefSeq (XR_)	24,553
pseudo transcripts	17
fully-supported	13
with > 5% ab initio	0
partial	0
with filled gap(s)	1
known RefSeq (NR_)	0
model RefSeq (XR_)	17
CDSs	76,698
fully-supported	59,348
with > 5% ab initio	15,672
partial	2,963
with major correction(s)	963
known RefSeq (NP_)	0
model RefSeq (XP_)	76,698

Detailed reports

The counts below do not include pseudogenes.

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	62,336	5,712	2,793	64	238,031
All transcripts	101,786	1,640	1,376	64	17,780
mRNA	76,611	1,725	1,458	114	17,780
misc_RNA	8,980	1,906	1,625	171	12,822
tRNA	614	74	73	70	92
lncRNA	14,201	1,215	876	114	14,107
snoRNA	494	106	93	64	226
snRNA	159	136	119	98	204
rRNA	727	414	119	103	3,563
Single-exon transcripts	9,309	1,121	900	114	8,026
coding transcripts (NM_/XM_ )	9,309	1,121	900	114	8,026
CDSs	76,698	1,223	978	90	17,361
Exons	315,916	333	176	1	11,610
in coding transcripts (NM_/XM_ )	267,925	330	174	1	11,610
in non-coding transcripts (NR_/XR_ )	62,787	320	161	2	11,246
Introns	241,043	1,412	380	28	146,621
in coding transcripts (NM_/XM_ )	208,346	1,385	365	28	146,621
in non-coding transcripts (NR_/XR_ )	46,599	1,506	452	28	86,944

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	1.64	1	1	50
Number of exons per transcript	5.6	4	1	81

Alignment of the annotated proteins to a set of high-quality proteins

The final set of annotated proteins was searched with BLASTP against the Arabidopsis thaliana known RefSeq proteins, using the annotated proteins as the query and the high-quality proteins as the target. Out of 50751 coding genes, 41057 genes had a protein with an alignment covering 50% or more of the query and 15308 had an alignment covering 95% or more of the query.

Definition of query and target coverage. The query coverage is the percentage of the annotated protein length that is included in the alignment. The target coverage is the percentage of the target length that is included in the alignment.

Below is a cumulative graph displaying the number of genes with alignments above a given query or target coverage threshold. For comparison, corresponding statistics for other organisms annotated by the NCBI eukaryotic annotation pipeline were added to the graph.

Query: annotated proteins
Target: Arabidopsis thaliana known RefSeq proteins

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker for each assembly. RepeatMasker results are only used for organisms for which a comprehensive repeat library is available.

For this annotation run, transcripts and proteins were aligned to the genome masked with WindowMasker only.

Assembly name	Assembly accession	% Masked with RepeatMasker	% Masked with WindowMasker
AHAU_CSS_1	GCF_004153795.1	2.97%	49.80%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Depending on the other evidence available, long 454 reads (with average length above 250 nt) may be aligned as traditional evidence and reported in the Transcript alignments section or aligned with RNA-Seq reads and reported in the RNA-Seq alignments section.

Transcript alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by Splign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Same-species Genbank	1,515	1,456 (96.11%)	1,329 (87.72%)	99.03%	97.01%
Same-species EST	49,403	37,876 (76.67%)	33,227 (67.26%)	98.59%	98.04%

RNA-Seq alignments

The following RNA-Seq reads from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics, by sample (SAME, SAMN, SAMD, DRS)

Sample Id	Publication	Track name	Number of reads	Percent aligned reads	Percent of aligned reads with introns	Number of introns
All	NA	Aggregate of all aligned samples	10,176,632,697	84%	33%	341,488
SAMN00993363	NA	Camellia sinensis var. sinensis (Camellia sinensis var. sinensis, SAMN00993363)	437,908	81%	61%	63,876
SAMN02688018	NA	third leaf, leaf (Camellia sinensis, 18months, SAMN02688018)	178,620	37%	40%	26,022
SAMN03392890	27609021	Leaf (Camellia sinensis, SAMN03392890)	37,230,292	47%	26%	173,307
SAMN05275840	NA	a bud and a leaf (Camellia sinensis, 4 years old tree, SAMN05275840)	40,636,918	66%	29%	118,286
SAMN05275841	NA	a bud and a leaf (Camellia sinensis, 4 years old tree, SAMN05275841)	37,278,798	64%	29%	91,313
SAMN05892030	NA	Leaf (Camellia sinensis, Two-year-old, SAMN05892030)	148,092,732	84%	35%	221,382
SAMN05892032	NA	Leaf (Camellia sinensis, Two-year-old, SAMN05892032)	131,124,346	85%	34%	218,509
SAMN05892037	NA	Leaf (Camellia sinensis, Two-year-old, SAMN05892037)	161,850,182	85%	32%	224,552
SAMN05892048	NA	Leaf (Camellia sinensis, Two-year-old, SAMN05892048)	93,462,296	83%	32%	207,974
SAMN07139138	NA	SCZ_NA leaves replication 1 (Camellia sinensis, 1, SAMN07139138)	46,987,152	86%	34%	201,876
SAMN07139139	NA	SCZ_NA leaves replication 2 (Camellia sinensis, 1, SAMN07139139)	46,987,152	88%	35%	204,578
SAMN07139140	NA	SCZ_CA_6h leaves replication 1 (Camellia sinensis, 1, SAMN07139140)	47,240,240	85%	33%	209,092
SAMN07139141	NA	SCZ_CA_6h leaves replication 2 (Camellia sinensis, 1, SAMN07139141)	49,392,036	83%	32%	203,741
SAMN07139142	NA	SCZ_CA1_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139142)	49,056,164	87%	35%	204,086
SAMN07139143	NA	SCZ_CA1_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139143)	49,243,704	87%	35%	204,102
SAMN07139144	NA	SCZ_CA2_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139144)	49,065,858	86%	34%	197,293
SAMN07139145	NA	SCZ_CA2_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139145)	47,971,432	87%	35%	199,396
SAMN07139146	NA	SCZ_DA_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139146)	47,132,506	86%	34%	207,074
SAMN07139147	NA	SCZ_DA_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139147)	46,369,732	85%	34%	206,032
SAMN07139148	NA	YH9_NA leaves replication 1 (Camellia sinensis, 1, SAMN07139148)	41,370,662	84%	36%	201,541
SAMN07139149	NA	YH9_NA leaves replication 2 (Camellia sinensis, 1, SAMN07139149)	48,488,528	86%	36%	205,977
SAMN07139150	NA	YH9_CA_6h leaves replication 1 (Camellia sinensis, 1, SAMN07139150)	46,197,300	87%	34%	204,836
SAMN07139151	NA	YH9_CA_6h leaves replication 2 (Camellia sinensis, 1, SAMN07139151)	49,226,262	86%	34%	201,990
SAMN07139152	NA	YH9_CA1_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139152)	46,987,152	86%	35%	203,784
SAMN07139153	NA	YH9_CA1_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139153)	45,849,136	87%	37%	203,740
SAMN07139154	NA	YH9_CA2_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139154)	42,970,742	84%	36%	195,556
SAMN07139155	NA	YH9_CA2_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139155)	49,056,164	86%	36%	207,794
SAMN07139156	NA	YH9_DA_7d leaves replication 1 (Camellia sinensis, 1, SAMN07139156)	48,414,250	88%	35%	208,946
SAMN07139157	NA	YH9_DA_7d leaves replication 2 (Camellia sinensis, 1, SAMN07139157)	47,521,424	86%	34%	205,467
SAMN07357011	NA	Leaf (Camellia sinensis, SAMN07357011)	110,227,300	84%	33%	217,752
SAMN07357012	NA	Leaf (Camellia sinensis, SAMN07357012)	111,494,516	84%	34%	217,787
SAMN07357013	NA	Leaf (Camellia sinensis, SAMN07357013)	129,174,616	83%	33%	222,076
SAMN07357014	NA	Leaf (Camellia sinensis, SAMN07357014)	107,426,028	83%	32%	223,540
SAMN07357015	NA	Leaf (Camellia sinensis, SAMN07357015)	113,025,764	84%	32%	218,930
SAMN07357016	NA	Leaf (Camellia sinensis, SAMN07357016)	120,741,048	84%	33%	221,788
SAMN07357017	NA	Leaf (Camellia sinensis, SAMN07357017)	110,992,376	84%	32%	217,672
SAMN07357018	NA	Leaf (Camellia sinensis, SAMN07357018)	106,374,972	84%	32%	215,507
SAMN07357019	NA	Leaf (Camellia sinensis, SAMN07357019)	100,308,656	83%	31%	217,941
SAMN07357020	NA	Leaf (Camellia sinensis, SAMN07357020)	114,586,120	83%	32%	214,812
SAMN07357021	NA	Leaf (Camellia sinensis, SAMN07357021)	114,453,308	83%	32%	216,810
SAMN07357022	NA	Leaf (Camellia sinensis, SAMN07357022)	118,837,496	83%	32%	217,068
SAMN07357023	NA	Leaf (Camellia sinensis, SAMN07357023)	109,022,852	84%	36%	213,107
SAMN07357024	NA	Leaf (Camellia sinensis, SAMN07357024)	97,480,704	84%	36%	214,001
SAMN07357025	NA	Leaf (Camellia sinensis, SAMN07357025)	104,138,920	84%	36%	212,690
SAMN07357045	NA	HSBC bud stage replication 1 (Camellia sinensis, 3, SAMN07357045)	36,681,296	89%	34%	196,549
SAMN07357046	NA	HSBC bud stage replication 2 (Camellia sinensis, 3, SAMN07357046)	36,036,346	89%	34%	197,612
SAMN07357047	NA	HSBC bud stage replication 3 (Camellia sinensis, 3, SAMN07357047)	35,861,428	89%	34%	196,504
SAMN07357048	NA	HSBC albino leaves replication 1 (Camellia sinensis, 3, SAMN07357048)	36,461,208	89%	34%	196,922
SAMN07357049	NA	HSBC albino leaves replication 2 (Camellia sinensis, 3, SAMN07357049)	35,837,756	89%	34%	197,886
SAMN07357050	NA	HSBC albino leaves replication 3 (Camellia sinensis, 3, SAMN07357050)	36,434,936	89%	34%	196,554
SAMN07357051	NA	HSBC albino trun green replication 1 (Camellia sinensis, 3, SAMN07357051)	36,641,916	89%	35%	192,268
SAMN07357052	NA	HSBC albino trun green replication 2 (Camellia sinensis, 3, SAMN07357052)	36,546,320	89%	35%	191,117
SAMN07357053	NA	HSBC albino trun green replication 3 (Camellia sinensis, 3, SAMN07357053)	36,529,486	89%	34%	191,119
SAMN07357054	NA	HSBC re-greening replication 1 (Camellia sinensis, 3, SAMN07357054)	36,620,450	89%	35%	193,230
SAMN07357055	NA	HSBC re-greening replication 2 (Camellia sinensis, 3, SAMN07357055)	35,675,220	89%	37%	197,954
SAMN07357056	NA	HSBC re-greening replication 3 (Camellia sinensis, 3, SAMN07357056)	36,603,242	88%	34%	191,676
SAMN07357057	NA	HSZ time same as HSBC-B replication 1 (Camellia sinensis, 3, SAMN07357057)	36,954,280	90%	32%	186,512
SAMN07357058	NA	HSZ time same as HSBC-B replication 2 (Camellia sinensis, 3, SAMN07357058)	35,749,274	90%	33%	187,401
SAMN07357059	NA	HSZ time same as HSBC-B replication 3 (Camellia sinensis, 3, SAMN07357059)	36,662,922	89%	32%	189,835
SAMN07357060	NA	HSZ time same as HSBC-LA replication 1 (Camellia sinensis, 3, SAMN07357060)	36,488,752	89%	32%	190,209
SAMN07357061	NA	HSZ time same as HSBC-LA replication 2 (Camellia sinensis, 3, SAMN07357061)	36,379,982	89%	32%	192,279
SAMN07357062	NA	HSZ time same as HSBC-LA replication 3 (Camellia sinensis, 3, SAMN07357062)	36,522,782	89%	32%	185,496
SAMN07357063	NA	HSZ time same as HSBC-LT replication 1 (Camellia sinensis, 3, SAMN07357063)	36,437,832	89%	35%	192,836
SAMN07357064	NA	HSZ time same as HSBC-LT replication 2 (Camellia sinensis, 3, SAMN07357064)	36,304,646	89%	35%	195,853
SAMN07357065	NA	HSZ time same as HSBC-LT replication 3 (Camellia sinensis, 3, SAMN07357065)	36,280,210	89%	35%	194,797
SAMN07357066	NA	HSZ time same as HSBC-LG replication 1 (Camellia sinensis, 3, SAMN07357066)	36,235,170	89%	34%	188,842
SAMN07357067	NA	HSZ time same as HSBC-LG replication 2 (Camellia sinensis, 3, SAMN07357067)	36,550,214	89%	34%	190,789
SAMN07357068	NA	HSZ time same as HSBC-LG replication 3 (Camellia sinensis, 3, SAMN07357068)	36,569,668	89%	33%	191,973
SAMN07515584	NA	Buds (Camellia sinensis, 10, SAMN07515584)	33,306,665	87%	35%	189,503
SAMN07515587	NA	Buds (Camellia sinensis, 10, SAMN07515587)	27,670,449	84%	35%	184,547
SAMN07515600	NA	Buds (Camellia sinensis, 10, SAMN07515600)	36,054,046	87%	34%	189,294
SAMN07515601	NA	Leaves (Camellia sinensis, 10, SAMN07515601)	24,872,942	86%	28%	146,332
SAMN07515606	NA	Leaves (Camellia sinensis, 10, SAMN07515606)	30,584,973	87%	27%	153,094
SAMN07515607	NA	Leaves (Camellia sinensis, 10, SAMN07515607)	30,665,811	87%	28%	154,412
SAMN07515608	NA	Leaves (Camellia sinensis, 10, SAMN07515608)	2,196,269	90%	35%	72,058
SAMN07515609	NA	Leaves (Camellia sinensis, 10, SAMN07515609)	29,959,505	90%	36%	145,634
SAMN07515612	NA	Leaves (Camellia sinensis, 10, SAMN07515612)	26,818,022	85%	33%	137,384
SAMN07515613	NA	Leaves (Camellia sinensis, 10, SAMN07515613)	26,292,622	80%	36%	149,022
SAMN07515614	NA	Leaves (Camellia sinensis, 10, SAMN07515614)	20,034,331	76%	35%	142,229
SAMN07515615	NA	Leaves (Camellia sinensis, 10, SAMN07515615)	31,037,372	71%	34%	144,366
SAMN07571740	NA	buds (Camellia sinensis, 5 years, SAMN07571740)	147,645,896	85%	32%	238,841
SAMN07572372	NA	roots (Camellia sinensis, 5 years, SAMN07572372)	145,999,742	73%	30%	215,684
SAMN07572539	NA	young leaves (Camellia sinensis, 5 years, SAMN07572539)	198,631,660	87%	31%	254,914
SAMN07574210	NA	mature leaves (Camellia sinensis, 5 years, SAMN07574210)	185,753,322	87%	33%	239,782
SAMN07580871	NA	stems (Camellia sinensis, 5 years, SAMN07580871)	149,603,976	83%	31%	230,598
SAMN07580892	NA	root (Camellia sinensis, one-year old, SAMN07580892)	663,606,958	84%	36%	313,398
SAMN07583504	NA	flowers (Camellia sinensis, 5 years, SAMN07583504)	128,497,064	85%	30%	216,895
SAMN07811449	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811449)	22,498,116	80%	22%	86,679
SAMN07811450	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811450)	28,105,672	84%	22%	92,734
SAMN07811451	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811451)	23,992,856	84%	21%	92,225
SAMN07811452	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811452)	31,759,734	84%	21%	97,866
SAMN07811453	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811453)	25,744,530	84%	22%	94,969
SAMN07811454	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811454)	27,129,926	82%	22%	94,543
SAMN07811455	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811455)	25,418,168	83%	23%	97,657
SAMN07811456	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811456)	31,876,778	84%	19%	97,177
SAMN07811457	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811457)	26,754,336	84%	21%	100,184
SAMN07811458	28851890	leaf (Camellia sinensis, 2 years, hermaphrodite, SAMN07811458)	27,293,256	85%	21%	95,707
SAMN08392131	NA	one bud and two leaves (Camellia sinensis var. sinensis, SAMN08392131)	140,059,550	86%	35%	242,634
SAMN08392132	NA	one bud and two leaves (Camellia sinensis var. sinensis, SAMN08392132)	136,945,568	85%	35%	234,307
SAMN08613092	NA	leaf (Camellia sinensis, one-year-old, SAMN08613092)	55,497,502	73%	32%	208,291
SAMN08613093	NA	root (Camellia sinensis, one-year-old, SAMN08613093)	56,082,168	64%	32%	204,352
SAMN08613523	NA	leaf (Camellia sinensis, one-year-old, SAMN08613523)	54,164,168	74%	32%	207,091
SAMN08613524	NA	root (Camellia sinensis, one-year-old, SAMN08613524)	54,364,156	67%	30%	193,808
SAMN08891736	NA	roots (Camellia sinensis var. sinensis, SAMN08891736)	44,471,912	88%	35%	186,175
SAMN08891739	NA	stems (Camellia sinensis var. sinensis, SAMN08891739)	44,453,920	89%	34%	198,884
SAMN08891750	NA	roots (Camellia sinensis var. sinensis, SAMN08891750)	44,408,788	89%	34%	188,455
SAMN08891752	NA	stems (Camellia sinensis var. sinensis, SAMN08891752)	44,592,676	89%	35%	201,223
SAMN08891753	NA	leaves (Camellia sinensis var. sinensis, SAMN08891753)	44,492,504	88%	33%	202,606
SAMN08891756	NA	roots (Camellia sinensis var. sinensis, SAMN08891756)	44,495,954	89%	34%	186,540
SAMN08891757	NA	stems (Camellia sinensis var. sinensis, SAMN08891757)	44,495,130	89%	34%	197,765
SAMN08891758	NA	leaves (Camellia sinensis var. sinensis, SAMN08891758)	44,402,174	88%	30%	194,905
SAMN09508715	NA	first leaf (Camellia sinensis, SAMN09508715)	44,517,824	88%	32%	199,468
SAMN09508716	NA	second leaf (Camellia sinensis, SAMN09508716)	44,521,440	87%	32%	204,449
SAMN09508717	NA	first leaf (Camellia sinensis, SAMN09508717)	43,054,028	87%	31%	198,565
SAMN09508718	NA	second leaf (Camellia sinensis, SAMN09508718)	45,021,662	87%	30%	201,850
SAMN10063975	30256509	young leaf (Camellia sinensis var. assamica, SAMN10063975)	112,085,354	88%	14%	205,627
SAMN10063976	30256509	young leaf (Camellia sinensis var. assamica, SAMN10063976)	103,206,882	89%	14%	204,152
SAMN10118788	NA	leaf (Camellia sinensis, SAMN10118788)	59,924,714	83%	34%	206,264
SAMN10118789	NA	leaf (Camellia sinensis, SAMN10118789)	62,139,180	83%	34%	206,629
SAMN10118790	NA	leaf (Camellia sinensis, SAMN10118790)	64,588,782	83%	32%	201,134
SAMN10118791	NA	leaf (Camellia sinensis, SAMN10118791)	64,028,680	84%	33%	200,892
SAMN10118792	NA	leaf (Camellia sinensis, SAMN10118792)	59,840,292	84%	34%	211,523
SAMN10118793	NA	leaf (Camellia sinensis, SAMN10118793)	67,414,236	83%	33%	215,008
SAMN10118794	NA	leaf (Camellia sinensis, SAMN10118794)	71,459,238	82%	32%	214,138
SAMN10118795	NA	leaf (Camellia sinensis, SAMN10118795)	65,030,654	82%	32%	213,050
SAMN10132112	NA	tea leaves (Camellia sinensis, SAMN10132112)	39,702,982	89%	36%	155,932
SAMN10132113	NA	tea leaves (Camellia sinensis, SAMN10132113)	38,016,924	88%	35%	158,399
SAMN10132114	NA	tea leaves (Camellia sinensis, SAMN10132114)	42,916,936	89%	36%	148,640
SAMN10132115	NA	tea leaves (Camellia sinensis, SAMN10132115)	42,953,886	88%	34%	155,122
SAMN10132116	NA	tea leaves (Camellia sinensis, SAMN10132116)	42,551,726	86%	35%	157,856
SAMN10132117	NA	tea leaves (Camellia sinensis, SAMN10132117)	37,567,224	87%	35%	152,126
SAMN10132118	NA	tea leaves (Camellia sinensis, SAMN10132118)	39,005,532	87%	35%	150,719
SAMN10132119	NA	tea leaves (Camellia sinensis, SAMN10132119)	35,802,186	86%	36%	162,864
SAMN10410589	NA	leaf (Camellia sinensis, one-year-old, SAMN10410589)	898,799,710	87%	36%	280,470
SAMN10782725	NA	calli (Camellia sinensis, SAMN10782725)	48,821,870	83%	36%	197,018
SAMN10782726	NA	calli (Camellia sinensis, SAMN10782726)	45,859,584	82%	35%	196,760
SAMN10782727	NA	calli (Camellia sinensis, SAMN10782727)	53,976,572	83%	36%	201,329
SAMN10782728	NA	calli (Camellia sinensis, SAMN10782728)	49,084,464	84%	37%	200,604
SAMN10782729	NA	calli (Camellia sinensis, SAMN10782729)	48,982,738	84%	37%	201,498
SAMN10782730	NA	calli (Camellia sinensis, SAMN10782730)	52,099,118	83%	37%	203,289
SAMN10838865	NA	Root (Camellia sinensis, 1 years, SAMN10838865)	44,981,996	81%	32%	205,756
SAMN10838866	NA	Root (Camellia sinensis, 1 years, SAMN10838866)	47,354,872	81%	33%	205,823
SAMN10838867	NA	Root (Camellia sinensis, 1 years, SAMN10838867)	45,358,878	82%	32%	196,220
SAMN10838868	NA	Root (Camellia sinensis, 1 years, SAMN10838868)	46,012,424	79%	33%	206,929
SAMN10838869	NA	Root (Camellia sinensis, 1 years, SAMN10838869)	45,094,810	82%	33%	213,009
SAMN10838870	NA	Root (Camellia sinensis, 1 years, SAMN10838870)	40,977,186	76%	33%	207,144
SAMN10838871	NA	Root (Camellia sinensis, 1 years, SAMN10838871)	46,118,540	83%	33%	212,627
SAMN10838872	NA	Root (Camellia sinensis, 1 years, SAMN10838872)	44,170,530	84%	34%	212,848
SAMN10838873	NA	Root (Camellia sinensis, 1 years, SAMN10838873)	47,974,238	83%	32%	212,008
SAMN10838874	NA	Root (Camellia sinensis, 1 years, SAMN10838874)	49,791,028	84%	32%	214,692
SAMN10838875	NA	Root (Camellia sinensis, 1 years, SAMN10838875)	45,655,726	84%	32%	214,361
SAMN10838876	NA	Root (Camellia sinensis, 1 years, SAMN10838876)	50,267,184	82%	32%	214,060

Show alignments statistics, by run (ERR, SRR, DRR)

Run	Experiment	Project	Sample	Number of reads	Percent aligned reads	Percent of aligned reads with introns
SRR496624	SRX147828	SRP013099	SAMN00993363	437,908	81%	61%
SRR1192484	SRX485271	SRP040015	SAMN02688018	178,620	37%	40%
SRR1849926	SRX905774	SRP055910	SAMN03392890	37,230,292	47%	26%
SRR3706110	SRX1867644	SRP076829	SAMN05275840	40,636,918	66%	29%
SRR3706111	SRX1867645	SRP076829	SAMN05275841	37,278,798	64%	29%
SRR4408349	SRX2234716	SRP091321	SAMN05892030	49,937,178	82%	35%
SRR4408424	SRX2234790	SRP091321	SAMN05892030	54,024,682	85%	34%
SRR4408425	SRX2234791	SRP091321	SAMN05892030	44,130,872	84%	35%
SRR4408426	SRX2234792	SRP091321	SAMN05892032	45,199,490	84%	34%
SRR4408447	SRX2234805	SRP091321	SAMN05892032	40,203,194	85%	34%
SRR4408452	SRX2234819	SRP091321	SAMN05892032	45,721,662	84%	34%
SRR4408453	SRX2234821	SRP091321	SAMN05892037	50,903,512	85%	32%
SRR4408454	SRX2234822	SRP091321	SAMN05892037	60,582,140	86%	32%
SRR4408456	SRX2234823	SRP091321	SAMN05892037	50,364,530	85%	32%
SRR4408457	SRX2234824	SRP091321	SAMN05892048	48,479,352	82%	32%
SRR4408460	SRX2234826	SRP091321	SAMN05892048	44,982,944	84%	31%
SRR5658676	SRX2895055	SRP108833	SAMN07139138	46,987,152	86%	34%
SRR5658675	SRX2895056	SRP108833	SAMN07139139	46,987,152	88%	35%
SRR5658674	SRX2895057	SRP108833	SAMN07139140	47,240,240	85%	33%
SRR5658673	SRX2895058	SRP108833	SAMN07139141	49,392,036	83%	32%
SRR5658672	SRX2895059	SRP108833	SAMN07139142	49,056,164	87%	35%
SRR5658671	SRX2895060	SRP108833	SAMN07139143	49,243,704	87%	35%
SRR5658670	SRX2895061	SRP108833	SAMN07139144	49,065,858	86%	34%
SRR5658669	SRX2895062	SRP108833	SAMN07139145	47,971,432	87%	35%
SRR5658668	SRX2895063	SRP108833	SAMN07139146	47,132,506	86%	34%
SRR5658667	SRX2895064	SRP108833	SAMN07139147	46,369,732	85%	34%
SRR5658662	SRX2895069	SRP108833	SAMN07139148	41,370,662	84%	36%
SRR5658661	SRX2895070	SRP108833	SAMN07139149	48,488,528	86%	36%
SRR5658664	SRX2895067	SRP108833	SAMN07139150	46,197,300	87%	34%
SRR5658663	SRX2895068	SRP108833	SAMN07139151	49,226,262	86%	34%
SRR5658658	SRX2895073	SRP108833	SAMN07139152	46,987,152	86%	35%
SRR5658657	SRX2895074	SRP108833	SAMN07139153	45,849,136	87%	37%
SRR5658660	SRX2895071	SRP108833	SAMN07139154	42,970,742	84%	36%
SRR5658659	SRX2895072	SRP108833	SAMN07139155	49,056,164	86%	36%
SRR5658666	SRX2895065	SRP108833	SAMN07139156	48,414,250	88%	35%
SRR5658665	SRX2895066	SRP108833	SAMN07139157	47,521,424	86%	34%
SRR5864630	SRX3008193	SRP112370	SAMN07357011	55,113,650	84%	33%
SRR5895912	SRX3061485	SRP112370	SAMN07357011	55,113,650	84%	33%
SRR5864640	SRX3008195	SRP112370	SAMN07357012	55,747,258	84%	34%
SRR5895913	SRX3061484	SRP112370	SAMN07357012	55,747,258	84%	34%
SRR5864642	SRX3008157	SRP112370	SAMN07357013	64,587,308	83%	33%
SRR5895914	SRX3061483	SRP112370	SAMN07357013	64,587,308	83%	33%
SRR5864625	SRX3008168	SRP112370	SAMN07357014	53,713,014	83%	32%
SRR5895915	SRX3061482	SRP112370	SAMN07357014	53,713,014	83%	32%
SRR5864618	SRX3008169	SRP112370	SAMN07357015	56,512,882	84%	32%
SRR5895904	SRX3061493	SRP112370	SAMN07357015	56,512,882	84%	32%
SRR5864616	SRX3008170	SRP112370	SAMN07357016	60,370,524	84%	33%
SRR5895906	SRX3061491	SRP112370	SAMN07357016	60,370,524	84%	33%
SRR5864600	SRX3008171	SRP112370	SAMN07357017	55,496,188	84%	32%
SRR5895905	SRX3061492	SRP112370	SAMN07357017	55,496,188	84%	32%
SRR5864599	SRX3008172	SRP112370	SAMN07357018	53,187,486	84%	32%
SRR5895907	SRX3061490	SRP112370	SAMN07357018	53,187,486	84%	32%
SRR5864587	SRX3008173	SRP112370	SAMN07357019	50,154,328	83%	31%
SRR5895916	SRX3061481	SRP112370	SAMN07357019	50,154,328	83%	31%
SRR5864586	SRX3008174	SRP112370	SAMN07357020	57,293,060	83%	32%
SRR5895918	SRX3061479	SRP112370	SAMN07357020	57,293,060	83%	32%
SRR5864580	SRX3008175	SRP112370	SAMN07357021	57,226,654	83%	32%
SRR5895908	SRX3061489	SRP112370	SAMN07357021	57,226,654	83%	32%
SRR5864571	SRX3008176	SRP112370	SAMN07357022	59,418,748	83%	32%
SRR5895909	SRX3061488	SRP112370	SAMN07357022	59,418,748	83%	32%
SRR5864570	SRX3008190	SRP112370	SAMN07357023	54,511,426	84%	36%
SRR5895910	SRX3061487	SRP112370	SAMN07357023	54,511,426	84%	36%
SRR5864559	SRX3008191	SRP112370	SAMN07357024	48,740,352	84%	36%
SRR5895911	SRX3061486	SRP112370	SAMN07357024	48,740,352	84%	36%
SRR5830865	SRX3008192	SRP112370	SAMN07357025	52,069,460	84%	36%
SRR5895917	SRX3061480	SRP112370	SAMN07357025	52,069,460	84%	36%
SRR5851972	SRX3021533	SRP113154	SAMN07357045	36,681,296	89%	34%
SRR5851973	SRX3021532	SRP113154	SAMN07357046	36,036,346	89%	34%
SRR5851970	SRX3021535	SRP113154	SAMN07357047	35,861,428	89%	34%
SRR5851971	SRX3021534	SRP113154	SAMN07357048	36,461,208	89%	34%
SRR5851968	SRX3021537	SRP113154	SAMN07357049	35,837,756	89%	34%
SRR5851969	SRX3021536	SRP113154	SAMN07357050	36,434,936	89%	34%
SRR5851966	SRX3021539	SRP113154	SAMN07357051	36,641,916	89%	35%
SRR5851967	SRX3021538	SRP113154	SAMN07357052	36,546,320	89%	35%
SRR5851974	SRX3021531	SRP113154	SAMN07357053	36,529,486	89%	34%
SRR5851975	SRX3021530	SRP113154	SAMN07357054	36,620,450	89%	35%
SRR5851984	SRX3021521	SRP113154	SAMN07357055	35,675,220	89%	37%
SRR5851985	SRX3021520	SRP113154	SAMN07357056	36,603,242	88%	34%
SRR5851982	SRX3021523	SRP113154	SAMN07357057	36,954,280	90%	32%
SRR5851983	SRX3021522	SRP113154	SAMN07357058	35,749,274	90%	33%
SRR5851980	SRX3021525	SRP113154	SAMN07357059	36,662,922	89%	32%
SRR5851981	SRX3021524	SRP113154	SAMN07357060	36,488,752	89%	32%
SRR5851978	SRX3021527	SRP113154	SAMN07357061	36,379,982	89%	32%
SRR5851979	SRX3021526	SRP113154	SAMN07357062	36,522,782	89%	32%
SRR5851976	SRX3021529	SRP113154	SAMN07357063	36,437,832	89%	35%
SRR5851977	SRX3021528	SRP113154	SAMN07357064	36,304,646	89%	35%
SRR5851965	SRX3021540	SRP113154	SAMN07357065	36,280,210	89%	35%
SRR5851964	SRX3021541	SRP113154	SAMN07357066	36,235,170	89%	34%
SRR5851963	SRX3021542	SRP113154	SAMN07357067	36,550,214	89%	34%
SRR5851962	SRX3021543	SRP113154	SAMN07357068	36,569,668	89%	33%
SRR5943812	SRX3102233	SRP115670	SAMN07515584	33,306,665	87%	35%
SRR5943814	SRX3102330	SRP115670	SAMN07515587	27,670,449	84%	35%
SRR5943846	SRX3102362	SRP115670	SAMN07515600	36,054,046	87%	34%
SRR5943848	SRX3102364	SRP115670	SAMN07515601	24,872,942	86%	28%
SRR5943849	SRX3102365	SRP115670	SAMN07515606	30,584,973	87%	27%
SRR5943850	SRX3102366	SRP115670	SAMN07515607	30,665,811	87%	28%
SRR5943851	SRX3102367	SRP115670	SAMN07515608	2,196,269	90%	35%
SRR5943852	SRX3102368	SRP115670	SAMN07515609	29,959,505	90%	36%
SRR5943853	SRX3102369	SRP115670	SAMN07515612	26,818,022	85%	33%
SRR5943854	SRX3102370	SRP115670	SAMN07515613	26,292,622	80%	36%
SRR5943855	SRX3102371	SRP115670	SAMN07515614	20,034,331	76%	35%
SRR5943856	SRX3102372	SRP115670	SAMN07515615	31,037,372	71%	34%
SRR5988352	SRX3144127	SRP116394	SAMN07571740	147,645,896	85%	32%
SRR5989447	SRX3145174	SRP116394	SAMN07572372	145,999,742	73%	30%
SRR5989880	SRX3145608	SRP116394	SAMN07572539	198,631,660	87%	31%
SRR5991647	SRX3147318	SRP116394	SAMN07574210	185,753,322	87%	33%
SRR5992415	SRX3148085	SRP116394	SAMN07580871	149,603,976	83%	31%
SRR5993087	SRX3148751	SRP116394	SAMN07583504	128,497,064	85%	30%
SRR5992801	SRX3148472	SRP116618	SAMN07580892	663,606,958	84%	36%
SRR7883603	SRX3299401	SRP120449	SAMN07811449	22,498,116	80%	22%
SRR7883604	SRX3299400	SRP120449	SAMN07811450	28,105,672	84%	22%
SRR7883605	SRX3299399	SRP120449	SAMN07811451	23,992,856	84%	21%
SRR7883606	SRX3299398	SRP120449	SAMN07811452	31,759,734	84%	21%
SRR7883599	SRX3299405	SRP120449	SAMN07811453	25,744,530	84%	22%
SRR7883600	SRX3299404	SRP120449	SAMN07811454	27,129,926	82%	22%
SRR7883601	SRX3299403	SRP120449	SAMN07811455	25,418,168	83%	23%
SRR7883602	SRX3299402	SRP120449	SAMN07811456	31,876,778	84%	19%
SRR7883607	SRX3299397	SRP120449	SAMN07811457	26,754,336	84%	21%
SRR7883608	SRX3299396	SRP120449	SAMN07811458	27,293,256	85%	21%
SRR6808108	SRX3766319	SRP133975	SAMN08613092	55,497,502	73%	32%
SRR6808107	SRX3766320	SRP133975	SAMN08613093	56,082,168	64%	32%
SRR6808106	SRX3766321	SRP133975	SAMN08613523	54,164,168	74%	32%
SRR6808105	SRX3766322	SRP133975	SAMN08613524	54,364,156	67%	30%
SRR6816671	SRX3773635	SRP134145	SAMN08392131	140,059,550	86%	35%
SRR6816672	SRX3773634	SRP134145	SAMN08392132	136,945,568	85%	35%
SRR7032259	SRX3964292	SRP141107	SAMN08891736	44,471,912	88%	35%
SRR7032260	SRX3964291	SRP141107	SAMN08891739	44,453,920	89%	34%
SRR7032257	SRX3964294	SRP141107	SAMN08891750	44,408,788	89%	34%
SRR7032258	SRX3964293	SRP141107	SAMN08891752	44,592,676	89%	35%
SRR7032255	SRX3964296	SRP141107	SAMN08891753	44,492,504	88%	33%
SRR7032256	SRX3964295	SRP141107	SAMN08891756	44,495,954	89%	34%
SRR7032253	SRX3964298	SRP141107	SAMN08891757	44,495,130	89%	34%
SRR7032254	SRX3964297	SRP141107	SAMN08891758	44,402,174	88%	30%
SRR7448161	SRX4318707	SRP151551	SAMN09508715	44,517,824	88%	32%
SRR7448162	SRX4318706	SRP151551	SAMN09508716	44,521,440	87%	32%
SRR7448159	SRX4318709	SRP151551	SAMN09508717	43,054,028	87%	31%
SRR7448160	SRX4318708	SRP151551	SAMN09508718	45,021,662	87%	30%
SRR7832305	SRX4683268	SRP161794	SAMN10063975	112,085,354	88%	14%
SRR7832304	SRX4683267	SRP161794	SAMN10063976	103,206,882	89%	14%
SRR7896776	SRX4734208	SRP162487	SAMN10118788	59,924,714	83%	34%
SRR7896775	SRX4734209	SRP162487	SAMN10118789	62,139,180	83%	34%
SRR7896778	SRX4734206	SRP162487	SAMN10118790	64,588,782	83%	32%
SRR7896777	SRX4734207	SRP162487	SAMN10118791	64,028,680	84%	33%
SRR7896772	SRX4734212	SRP162487	SAMN10118792	59,840,292	84%	34%
SRR7896771	SRX4734213	SRP162487	SAMN10118793	67,414,236	83%	33%
SRR7896774	SRX4734210	SRP162487	SAMN10118794	71,459,238	82%	32%
SRR7896773	SRX4734211	SRP162487	SAMN10118795	65,030,654	82%	32%
SRR7904261	SRX4740718	SRP162639	SAMN10132112	39,702,982	89%	36%
SRR7904262	SRX4740717	SRP162639	SAMN10132113	38,016,924	88%	35%
SRR7904259	SRX4740720	SRP162639	SAMN10132114	42,916,936	89%	36%
SRR7904260	SRX4740719	SRP162639	SAMN10132115	42,953,886	88%	34%
SRR7904257	SRX4740722	SRP162639	SAMN10132116	42,551,726	86%	35%
SRR7904258	SRX4740721	SRP162639	SAMN10132117	37,567,224	87%	35%
SRR7904255	SRX4740724	SRP162639	SAMN10132118	39,005,532	87%	35%
SRR7904256	SRX4740723	SRP162639	SAMN10132119	35,802,186	86%	36%
SRR8204268	SRX5023577	SRP169514	SAMN10410589	54,899,916	88%	35%
SRR8204267	SRX5023578	SRP169514	SAMN10410589	50,400,724	88%	36%
SRR8204266	SRX5023579	SRP169514	SAMN10410589	53,975,114	87%	34%
SRR8204265	SRX5023580	SRP169514	SAMN10410589	51,537,072	87%	35%
SRR8204264	SRX5023581	SRP169514	SAMN10410589	52,018,776	87%	35%
SRR8204263	SRX5023582	SRP169514	SAMN10410589	48,917,290	87%	34%
SRR8204262	SRX5023583	SRP169514	SAMN10410589	49,282,954	84%	36%
SRR8204261	SRX5023584	SRP169514	SAMN10410589	51,308,034	87%	36%
SRR8204260	SRX5023585	SRP169514	SAMN10410589	49,135,628	87%	34%
SRR8204259	SRX5023586	SRP169514	SAMN10410589	50,430,224	87%	36%
SRR8204258	SRX5023587	SRP169514	SAMN10410589	46,997,262	87%	36%
SRR8204257	SRX5023588	SRP169514	SAMN10410589	48,278,556	86%	37%
SRR8204256	SRX5023589	SRP169514	SAMN10410589	49,516,176	86%	36%
SRR8204255	SRX5023590	SRP169514	SAMN10410589	52,508,572	84%	35%
SRR8204254	SRX5023591	SRP169514	SAMN10410589	48,376,088	87%	37%
SRR8204253	SRX5023592	SRP169514	SAMN10410589	44,543,838	88%	37%
SRR8204252	SRX5023593	SRP169514	SAMN10410589	46,690,374	88%	36%
SRR8204251	SRX5023594	SRP169514	SAMN10410589	49,983,112	88%	37%
SRR8466745	SRX5273322	SRP180960	SAMN10782725	48,821,870	83%	36%
SRR8466744	SRX5273323	SRP180960	SAMN10782726	45,859,584	82%	35%
SRR8466743	SRX5273324	SRP180960	SAMN10782727	53,976,572	83%	36%
SRR8466742	SRX5273325	SRP180960	SAMN10782728	49,084,464	84%	37%
SRR8466747	SRX5273320	SRP180960	SAMN10782729	48,982,738	84%	37%
SRR8466746	SRX5273321	SRP180960	SAMN10782730	52,099,118	83%	37%
SRR8501263	SRX5305260	SRP182771	SAMN10838865	44,981,996	81%	32%
SRR8501264	SRX5305259	SRP182771	SAMN10838866	47,354,872	81%	33%
SRR8501265	SRX5305258	SRP182771	SAMN10838867	45,358,878	82%	32%
SRR8501266	SRX5305257	SRP182771	SAMN10838868	46,012,424	79%	33%
SRR8501259	SRX5305264	SRP182771	SAMN10838869	45,094,810	82%	33%
SRR8501260	SRX5305263	SRP182771	SAMN10838870	40,977,186	76%	33%
SRR8501261	SRX5305262	SRP182771	SAMN10838871	46,118,540	83%	33%
SRR8501262	SRX5305261	SRP182771	SAMN10838872	44,170,530	84%	34%
SRR8501257	SRX5305266	SRP182771	SAMN10838873	47,974,238	83%	32%
SRR8501258	SRX5305265	SRP182771	SAMN10838874	49,791,028	84%	32%
SRR8501255	SRX5305268	SRP182771	SAMN10838875	45,655,726	84%	32%
SRR8501256	SRX5305267	SRP182771	SAMN10838876	50,267,184	82%	32%

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Arabidopsis thaliana GenBank	53,534	49,575 (92.60%)	49,575 (92.60%)	69.31%	74.51%
Arabidopsis thaliana known RefSeq (NP_)	48,147	42,551 (88.38%)	42,551 (88.38%)	67.21%	70.43%
Same-species GenBank	1,182	1,167 (98.73%)	1,167 (98.73%)	77.62%	85.69%
asterids GenBank	30,703	29,362 (95.63%)	29,362 (95.63%)	71.69%	80.32%
asterids known RefSeq (NP_)	5,517	5,396 (97.81%)	5,396 (97.81%)	71.63%	79.65%

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20

RefSeq

Integrated reference sequences