NCBI Arabidopsis lyrata subsp. lyrata Annotation Release 101

The RefSeq genome records for Arabidopsis lyrata subsp. lyrata were annotated by the NCBI Eukaryotic Genome Annotation Pipeline, an automated pipeline that annotates genes, transcripts and proteins on draft and finished genome assemblies. This report presents statistics on the annotation products, the input data used in the pipeline and intermediate alignment results.

The annotation products are available in the sequence databases and on the FTP site.

This report provides:

Annotation Release information: The name of the release, important dates, the software version
Assemblies: A brief description of the annotated assembly(ies)
Gene and feature statistics: The counts and characteristics of the annotated features
Alignment of the annotated proteins to a set of high-quality proteins: The number of annotated proteins with hits to a set of high-quality proteins
Masking of genomic sequence: How much of the genome was masked
Transcript and protein alignments: The number and type of evidence retrieved from public databases and used for gene prediction
Comparison of the current and previous annotations: What proportion of the genes changed in this annotation

For more information on the annotation process, please visit the NCBI Eukaryotic Genome Annotation Pipeline page.

Annotation Release information

This annotation should be referred to as NCBI Arabidopsis lyrata subsp. lyrata Annotation Release 101

Annotation release ID: 101
Date of Entrez queries for transcripts and proteins: May 2 2017
Date of submission of annotation to the public databases: May 11 2017
Software version: 7.4

Assemblies

The following assemblies were included in this annotation run:

Assembly name	Assembly accession	Submitter	Assembly date	Reference/Alternate	Assembly content
v.1.0	GCF_000004255.2	US DOE Joint Genome Institute (JGI-PGF)	11-26-2016	Reference	1 assembled chromosomes; unplaced scaffolds

Gene and feature statistics

Counts and length of annotated features are provided below for each assembly.

Feature counts

Feature	v.1.0
Genes and pseudogenes	34,221
protein-coding	29,733
non-coding	3,071
pseudogenes	1,417
genes with variants	6,799
mRNAs	39,076
fully-supported	37,019
with > 5% ab initio	1,312
partial	394
with filled gap(s)	0
known RefSeq (NM_)	0
model RefSeq (XM_)	39,076
Other RNAs	5,838
fully-supported	5,305
with > 5% ab initio	0
partial	0
with filled gap(s)	0
known RefSeq (NR_)	0
model RefSeq (XR_)	5,305
CDSs	39,076
fully-supported	37,019
with > 5% ab initio	1,432
partial	394
with major correction(s)	1,753
known RefSeq (NP_)	0
model RefSeq (XP_)	39,076

Detailed reports

Feature lengths

Feature	Count	Mean length (bp)	Median length (bp)	Min length (bp)	Max length (bp)
Genes	32,804	2,457	2,009	71	84,732
All transcripts	44,914	1,705	1,481	71	16,433
mRNA	39,076	1,753	1,543	99	16,433
misc_RNA	1,107	1,939	1,615	173	12,010
tRNA	533	74	73	71	87
lncRNA	4,198	1,400	960	94	10,080
Single-exon transcripts	5,616	1,330	1,215	99	5,258
coding transcripts (NM_/XM_ )	5,616	1,330	1,215	99	5,258
CDSs	39,076	1,301	1,098	63	16,176
Exons	184,462	314	171	1	7,734
in coding transcripts (NM_/XM_ )	172,159	315	168	1	7,734
in non-coding transcripts (NR_/XR_ )	15,201	293	182	3	6,665
Introns	144,856	224	103	30	82,903
in coding transcripts (NM_/XM_ )	136,661	216	102	30	82,903
in non-coding transcripts (NR_/XR_ )	11,051	311	125	30	25,783

Transcripts per gene, exons per transcript

	Mean	Median	Min	Max
Number of transcripts per gene	1.38	1	1	50
Number of exons per transcript	6	4	1	79

Alignment of the annotated proteins to a set of high-quality proteins

The final set of annotated proteins was searched with BLASTP against the Arabidopsis thaliana known RefSeq proteins, using the annotated proteins as the query and the high-quality proteins as the target. Out of 29733 coding genes, 28653 genes had a protein with an alignment covering 50% or more of the query and 23740 had an alignment covering 95% or more of the query.

Definition of query and target coverage. The query coverage is the percentage of the annotated protein length that is included in the alignment. The target coverage is the percentage of the target length that is included in the alignment.

Below is a cumulative graph displaying the number of genes with alignments above a given query or target coverage threshold. For comparison, corresponding statistics for other organisms annotated by the NCBI eukaryotic annotation pipeline were added to the graph.

Query: annotated proteins
Target: Arabidopsis thaliana known RefSeq proteins

Masking of genomic sequence

Transcript and protein alignments are performed on the repeat-masked genome. Below are the percentages of genomic sequence masked by WindowMasker and RepeatMasker for each assembly. RepeatMasker results are only used for organisms for which a comprehensive repeat library is available.

For this annotation run, transcripts and proteins were aligned to the genome masked with WindowMasker and RepeatMasker only.

Assembly name	Assembly accession	% Masked with RepeatMasker	% Masked with WindowMasker
v.1.0	GCF_000004255.2	18.30%	23.79%

Transcript and protein alignments

The annotation pipeline relies heavily on alignments of experimental evidence for gene prediction. Below are the sets of transcripts and proteins that were retrieved from Entrez, aligned to the genome by Splign or ProSplign and passed to Gnomon, NCBI's gene prediction software.

Depending on the other evidence available, long 454 reads (with average length above 250 nt) may be aligned as traditional evidence and reported in the Transcript alignments section or aligned with RNA-Seq reads and reported in the RNA-Seq alignments section.

Transcript alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by Splign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Arabidopsis thaliana known RefSeq (NM_/NR_)	53,828	48,083 (89.33%)	22,632 (42.05%)	91.73%	94.12%
Arabidopsis thaliana Genbank	145,207	75,944 (52.30%)	55,185 (38.00%)	92.95%	97.01%
Arabidopsis thaliana EST	1,509,658	890,455 (58.98%)	519,452 (34.41%)	92.98%	97.73%
Arabidopsis lyrata Genbank	95	84 (88.42%)	41 (43.16%)	98.60%	99.53%
Arabidopsis lyrata EST	572	449 (78.50%)	438 (76.57%)	97.95%	99.21%

RNA-Seq alignments

The following RNA-Seq reads from the Sequence Read Archive were also used for gene prediction:

Hide alignments statistics, by sample (SAME, SAMN, SAMD, DRS)

Sample Id	Publication	Track name	Number of reads	Percent aligned reads	Percent of aligned reads with introns	Number of introns
All	NA	Aggregate of all aligned samples	4,065,198,698	79%	23%	166,420
SAMD00035310	27428747	leaf, control (Arabidopsis lyrata subsp. petraea, SAMD00035310)	86,990,100	79%	26%	120,118
SAMD00035311	27428747	leaf, zinc treated (Arabidopsis lyrata subsp. petraea, SAMD00035311)	85,528,512	79%	27%	121,809
SAMD00035312	27428747	root, control (Arabidopsis lyrata subsp. petraea, SAMD00035312)	142,412,254	79%	29%	125,946
SAMD00035313	27428747	root, zinc treated (Arabidopsis lyrata subsp. petraea, SAMD00035313)	120,011,320	76%	27%	124,081
SAMEA3936191	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936191)	23,482,921	83%	21%	109,982
SAMEA3936192	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936192)	26,465,102	83%	21%	108,711
SAMEA3936193	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936193)	22,486,764	82%	20%	104,791
SAMEA3936194	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936194)	20,000,153	82%	20%	108,831
SAMEA3936195	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936195)	20,506,833	82%	21%	106,966
SAMEA3936196	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936196)	26,533,897	83%	21%	111,611
SAMEA3936197	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936197)	23,073,124	82%	20%	108,319
SAMEA3936198	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936198)	21,938,353	82%	21%	108,839
SAMEA3936199	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936199)	22,301,954	83%	20%	108,390
SAMEA3936200	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936200)	27,200,374	80%	21%	112,234
SAMEA3936201	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936201)	23,397,290	81%	20%	106,536
SAMEA3936202	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936202)	21,163,659	79%	21%	108,197
SAMEA3936203	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936203)	21,023,991	79%	20%	103,067
SAMEA3936204	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936204)	26,845,584	82%	21%	109,780
SAMEA3936205	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936205)	28,387,041	80%	20%	111,064
SAMEA3936206	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936206)	21,576,171	82%	21%	108,676
SAMEA3936207	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936207)	23,315,555	83%	21%	107,201
SAMEA3936208	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936208)	22,123,177	84%	20%	107,862
SAMEA3936209	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936209)	26,475,761	81%	21%	111,369
SAMEA3936210	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936210)	24,124,844	82%	20%	107,343
SAMEA3936211	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936211)	20,191,204	83%	20%	105,472
SAMEA3936212	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936212)	27,431,565	82%	20%	109,948
SAMEA3936213	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936213)	21,101,018	81%	20%	105,407
SAMEA3936214	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936214)	19,507,896	84%	20%	107,073
SAMEA3936215	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936215)	21,853,411	83%	20%	107,842
SAMEA3936216	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936216)	26,341,597	82%	20%	110,444
SAMEA3936217	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936217)	23,921,520	83%	19%	109,733
SAMEA3936218	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936218)	19,918,590	83%	21%	105,897
SAMEA3936219	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936219)	24,715,714	80%	20%	108,775
SAMEA3936220	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936220)	24,228,912	83%	21%	108,498
SAMEA3936221	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936221)	24,445,928	73%	19%	104,987
SAMEA3936222	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936222)	27,864,322	83%	21%	111,998
SAMEA3936223	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936223)	19,574,705	81%	20%	102,976
SAMEA3936224	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936224)	28,733,759	82%	21%	108,933
SAMEA3936225	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936225)	19,193,963	82%	21%	103,674
SAMEA3936226	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936226)	25,481,504	81%	20%	107,710
SAMEA3936227	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936227)	24,160,846	82%	21%	106,734
SAMEA3936228	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936228)	20,984,083	84%	21%	107,211
SAMEA3936229	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936229)	25,673,134	79%	19%	107,057
SAMEA3936230	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936230)	16,621,673	83%	20%	103,037
SAMEA3936231	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936231)	24,237,478	83%	21%	109,040
SAMEA3936232	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936232)	16,964,484	80%	20%	107,591
SAMEA3936233	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936233)	23,389,267	82%	20%	107,362
SAMEA3936234	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936234)	21,574,386	82%	21%	107,138
SAMEA3936235	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936235)	27,210,469	81%	21%	110,426
SAMEA3936236	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936236)	30,947,400	83%	20%	111,307
SAMEA3936237	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936237)	24,508,447	82%	21%	108,858
SAMEA3936238	NA	leaf (Arabidopsis lyrata subsp. lyrata, SAMEA3936238)	25,527,649	83%	21%	108,931
SAMN01995760	23749190	flowers (Arabidopsis lyrata, SAMN01995760)	6,727,141	83%	19%	98,021
SAMN01995761	23749190	flowers (Arabidopsis lyrata, SAMN01995761)	5,080,925	84%	19%	91,765
SAMN02192674	NA	Seed (Arabidopsis lyrata, SAMN02192674)	26,229,638	87%	22%	104,743
SAMN02192675	NA	Root (Arabidopsis lyrata, SAMN02192675)	34,063,775	81%	23%	114,203
SAMN02192676	NA	Flowerbud (Arabidopsis lyrata, SAMN02192676)	25,271,038	80%	20%	106,707
SAMN02630000	NA	young leaves (Arabidopsis lyrata, SAMN02630000)	17,342,335	94%	27%	112,512
SAMN03201437	26429922	leaves (Arabidopsis lyrata, plants after bolting, SAMN03201437)	16,959,886	94%	11%	94,007
SAMN03201439	26429922	leaves (Arabidopsis lyrata, plants after bolting, SAMN03201439)	14,187,778	94%	11%	95,746
SAMN03201441	26429922	Inflorescences (Arabidopsis lyrata, plants after bolting, SAMN03201441)	15,900,646	94%	11%	105,296
SAMN03201443	26429922	leaves (Arabidopsis lyrata, plants after bolting, SAMN03201443)	14,134,623	94%	11%	94,248
SAMN03201445	26429922	Inflorescences (Arabidopsis lyrata, plants after bolting, SAMN03201445)	15,174,903	94%	11%	104,762
SAMN03201446	26429922	Inflorescences (Arabidopsis lyrata, plants after bolting, SAMN03201446)	8,988,419	94%	11%	98,618
SAMN03383048	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383048)	18,465,941	95%	25%	102,275
SAMN03383049	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383049)	35,284,803	96%	26%	106,441
SAMN03383050	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383050)	15,511,305	95%	23%	98,722
SAMN03383051	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383051)	26,125,194	96%	26%	104,005
SAMN03383052	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383052)	23,573,212	95%	24%	100,883
SAMN03383053	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383053)	27,283,600	96%	26%	105,178
SAMN03383054	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383054)	24,720,375	96%	25%	100,833
SAMN03383055	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383055)	6,159,937	92%	21%	76,045
SAMN03383056	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383056)	25,668,793	94%	23%	102,011
SAMN03383057	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383057)	8,061,423	91%	19%	73,515
SAMN03383058	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383058)	23,503,432	93%	21%	100,423
SAMN03383059	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383059)	19,875,686	93%	21%	97,764
SAMN03383060	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383060)	16,889,397	88%	16%	94,622
SAMN03383061	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383061)	29,308,793	95%	24%	104,973
SAMN03383062	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383062)	30,077,415	95%	24%	105,768
SAMN03383063	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383063)	20,143,772	95%	24%	100,496
SAMN03383064	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383064)	11,864,554	95%	23%	92,962
SAMN03383065	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383065)	14,381,074	93%	23%	93,408
SAMN03383066	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383066)	24,412,439	94%	23%	102,509
SAMN03383067	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383067)	21,266,057	95%	24%	103,836
SAMN03383068	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383068)	19,236,199	92%	21%	93,688
SAMN03383069	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383069)	23,101,696	94%	22%	101,359
SAMN03383070	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383070)	17,655,726	93%	22%	99,722
SAMN03383071	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383071)	20,677,354	92%	20%	96,185
SAMN03383072	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383072)	17,418,237	93%	22%	97,820
SAMN03383073	NA	leaf (Arabidopsis lyrata, 12 weeks, SAMN03383073)	11,868,065	89%	18%	88,967
SAMN03702817	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702817)	16,493,299	80%	26%	107,507
SAMN03702818	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702818)	19,272,053	82%	26%	109,790
SAMN03702819	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702819)	13,643,519	79%	22%	97,970
SAMN03702820	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702820)	45,850,200	78%	24%	112,201
SAMN03702821	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702821)	15,625,259	87%	26%	108,228
SAMN03702822	26382944	rosettes - 5 leaves stage (Arabidopsis lyrata subsp. lyrata, SAMN03702822)	39,933,397	75%	26%	117,245
SAMN03734509	26382944	entire vegetative rosette (Arabidopsis lyrata subsp. lyrata, SAMN03734509)	19,625,903	92%	28%	115,671
SAMN03734510	26382944	entire vegetative rosette (Arabidopsis lyrata subsp. lyrata, SAMN03734510)	18,123,255	92%	26%	106,649
SAMN03734511	26382944	dissected shoot apical meristem (Arabidopsis lyrata subsp. lyrata, SAMN03734511)	14,561,819	87%	26%	116,734
SAMN03734512	26382944	entire inflorescence (Arabidopsis lyrata subsp. lyrata, SAMN03734512)	35,722,008	94%	25%	130,549
SAMN03734513	26382944	entire inflorescence (Arabidopsis lyrata subsp. lyrata, SAMN03734513)	33,330,962	91%	24%	131,428
SAMN04346888	27643534	KarxKar_endo3 (Arabidopsis lyrata, SAMN04346888)	158,978,414	79%	24%	119,320
SAMN04346889	27643534	KarxMN_emb1 (Arabidopsis lyrata, SAMN04346889)	130,645,666	60%	27%	129,506
SAMN04346893	27643534	KarxMN_endo3 (Arabidopsis lyrata, SAMN04346893)	151,442,252	61%	24%	113,114
SAMN04346894	27643534	KarxMN_endo4 (Arabidopsis lyrata, SAMN04346894)	141,685,822	71%	23%	103,088
SAMN04346895	27643534	KarxMN_emb2 (Arabidopsis lyrata, SAMN04346895)	189,873,038	64%	27%	132,475
SAMN04346900	27643534	MNxKar_emb3 (Arabidopsis lyrata, SAMN04346900)	40,410,108	84%	28%	118,699
SAMN04346903	27643534	MNxKar_endo3 (Arabidopsis lyrata, SAMN04346903)	136,403,412	87%	26%	131,245
SAMN04346966	27643534	KarxKar_emb3 (Arabidopsis lyrata, SAMN04346966)	102,211,464	72%	21%	110,633
SAMN04346967	27643534	KarxKar_emb4 (Arabidopsis lyrata, SAMN04346967)	44,463,478	84%	27%	111,776
SAMN04346968	27643534	KarxKar_endo1 (Arabidopsis lyrata, SAMN04346968)	202,747,630	66%	20%	116,469
SAMN04346969	27643534	KarxKar_endo2 (Arabidopsis lyrata, SAMN04346969)	123,663,638	61%	25%	115,761
SAMN05503925	27485883	leaf (Arabidopsis lyrata, SAMN05503925)	22,559,640	89%	27%	108,728
SAMN05503926	27485883	flower (Arabidopsis lyrata, SAMN05503926)	15,137,094	75%	26%	114,397
SAMN05503927	27485883	stem (Arabidopsis lyrata, SAMN05503927)	18,294,896	91%	27%	108,691
SAMN05503928	27485883	root (Arabidopsis lyrata, SAMN05503928)	18,235,228	90%	28%	111,965

Show alignments statistics, by run (ERR, SRR, DRR)

Run	Experiment	Project	Sample	Number of reads	Percent aligned reads	Percent of aligned reads with introns
DRR054447	DRX049296	DRP003263	SAMD00035310	86,990,100	79%	26%
DRR054448	DRX049297	DRP003263	SAMD00035311	85,528,512	79%	27%
DRR054449	DRX049298	DRP003263	SAMD00035312	142,412,254	79%	29%
DRR054450	DRX049299	DRP003263	SAMD00035313	120,011,320	76%	27%
ERR1368764	ERX1439890	ERP015221	SAMEA3936191	23,482,921	83%	21%
ERR1368765	ERX1439891	ERP015221	SAMEA3936192	26,465,102	83%	21%
ERR1368766	ERX1439892	ERP015221	SAMEA3936193	22,486,764	82%	20%
ERR1368767	ERX1439893	ERP015221	SAMEA3936194	20,000,153	82%	20%
ERR1368768	ERX1439894	ERP015221	SAMEA3936195	20,506,833	82%	21%
ERR1368769	ERX1439895	ERP015221	SAMEA3936196	26,533,897	83%	21%
ERR1368770	ERX1439896	ERP015221	SAMEA3936197	23,073,124	82%	20%
ERR1368771	ERX1439897	ERP015221	SAMEA3936198	21,938,353	82%	21%
ERR1368772	ERX1439898	ERP015221	SAMEA3936199	22,301,954	83%	20%
ERR1368773	ERX1439899	ERP015221	SAMEA3936200	27,200,374	80%	21%
ERR1368774	ERX1439900	ERP015221	SAMEA3936201	23,397,290	81%	20%
ERR1368775	ERX1439901	ERP015221	SAMEA3936202	21,163,659	79%	21%
ERR1368776	ERX1439902	ERP015221	SAMEA3936203	21,023,991	79%	20%
ERR1368777	ERX1439903	ERP015221	SAMEA3936204	26,845,584	82%	21%
ERR1368778	ERX1439904	ERP015221	SAMEA3936205	28,387,041	80%	20%
ERR1368779	ERX1439905	ERP015221	SAMEA3936206	21,576,171	82%	21%
ERR1368780	ERX1439906	ERP015221	SAMEA3936207	23,315,555	83%	21%
ERR1368781	ERX1439907	ERP015221	SAMEA3936208	22,123,177	84%	20%
ERR1368782	ERX1439908	ERP015221	SAMEA3936209	26,475,761	81%	21%
ERR1368783	ERX1439909	ERP015221	SAMEA3936210	24,124,844	82%	20%
ERR1368784	ERX1439910	ERP015221	SAMEA3936211	20,191,204	83%	20%
ERR1368785	ERX1439911	ERP015221	SAMEA3936212	27,431,565	82%	20%
ERR1368786	ERX1439912	ERP015221	SAMEA3936213	21,101,018	81%	20%
ERR1368787	ERX1439913	ERP015221	SAMEA3936214	19,507,896	84%	20%
ERR1368788	ERX1439914	ERP015221	SAMEA3936215	21,853,411	83%	20%
ERR1368789	ERX1439915	ERP015221	SAMEA3936216	26,341,597	82%	20%
ERR1368790	ERX1439916	ERP015221	SAMEA3936217	23,921,520	83%	19%
ERR1368791	ERX1439917	ERP015221	SAMEA3936218	19,918,590	83%	21%
ERR1368792	ERX1439918	ERP015221	SAMEA3936219	24,715,714	80%	20%
ERR1368793	ERX1439919	ERP015221	SAMEA3936220	24,228,912	83%	21%
ERR1368794	ERX1439920	ERP015221	SAMEA3936221	24,445,928	73%	19%
ERR1368795	ERX1439921	ERP015221	SAMEA3936222	27,864,322	83%	21%
ERR1368796	ERX1439922	ERP015221	SAMEA3936223	19,574,705	81%	20%
ERR1368797	ERX1439923	ERP015221	SAMEA3936224	28,733,759	82%	21%
ERR1368798	ERX1439924	ERP015221	SAMEA3936225	19,193,963	82%	21%
ERR1368799	ERX1439925	ERP015221	SAMEA3936226	25,481,504	81%	20%
ERR1368800	ERX1439926	ERP015221	SAMEA3936227	24,160,846	82%	21%
ERR1368801	ERX1439927	ERP015221	SAMEA3936228	20,984,083	84%	21%
ERR1368802	ERX1439928	ERP015221	SAMEA3936229	25,673,134	79%	19%
ERR1368803	ERX1439929	ERP015221	SAMEA3936230	16,621,673	83%	20%
ERR1368804	ERX1439930	ERP015221	SAMEA3936231	24,237,478	83%	21%
ERR1368805	ERX1439931	ERP015221	SAMEA3936232	16,964,484	80%	20%
ERR1368806	ERX1439932	ERP015221	SAMEA3936233	23,389,267	82%	20%
ERR1368807	ERX1439933	ERP015221	SAMEA3936234	21,574,386	82%	21%
ERR1368808	ERX1439934	ERP015221	SAMEA3936235	27,210,469	81%	21%
ERR1368809	ERX1439935	ERP015221	SAMEA3936236	30,947,400	83%	20%
ERR1368810	ERX1439936	ERP015221	SAMEA3936237	24,508,447	82%	21%
ERR1368811	ERX1439937	ERP015221	SAMEA3936238	25,527,649	83%	21%
SRR800644	SRX257635	SRP020356	SAMN01995760	6,727,141	83%	19%
SRR800645	SRX257636	SRP020356	SAMN01995761	5,080,925	84%	19%
SRR891267	SRX297999	SRP024292	SAMN02192674	26,229,638	87%	22%
SRR891293	SRX298018	SRP024292	SAMN02192675	34,063,775	81%	23%
SRR891324	SRX298044	SRP024292	SAMN02192676	25,271,038	80%	20%
SRR1162940	SRX466007	SRP036730	SAMN02630000	17,342,335	94%	27%
SRR1657470	SRX763945	SRP050051	SAMN03201437	16,959,886	94%	11%
SRR1657471	SRX763946	SRP050051	SAMN03201439	14,187,778	94%	11%
SRR1657476	SRX763951	SRP050051	SAMN03201441	15,900,646	94%	11%
SRR1657472	SRX763947	SRP050051	SAMN03201443	14,134,623	94%	11%
SRR1657478	SRX763953	SRP050051	SAMN03201445	15,174,903	94%	11%
SRR1657477	SRX763952	SRP050051	SAMN03201446	8,988,419	94%	11%
SRR1868042	SRX912503	SRP055956	SAMN03383048	18,465,941	95%	25%
SRR1868043	SRX912504	SRP055956	SAMN03383049	35,284,803	96%	26%
SRR1868044	SRX912505	SRP055956	SAMN03383050	15,511,305	95%	23%
SRR1868045	SRX912506	SRP055956	SAMN03383051	26,125,194	96%	26%
SRR1868046	SRX912507	SRP055956	SAMN03383052	23,573,212	95%	24%
SRR1868047	SRX912508	SRP055956	SAMN03383053	27,283,600	96%	26%
SRR1868048	SRX912509	SRP055956	SAMN03383054	24,720,375	96%	25%
SRR1868049	SRX912510	SRP055956	SAMN03383055	6,159,937	92%	21%
SRR1868050	SRX912511	SRP055956	SAMN03383056	25,668,793	94%	23%
SRR1868051	SRX912512	SRP055956	SAMN03383057	8,061,423	91%	19%
SRR1868052	SRX912513	SRP055956	SAMN03383058	23,503,432	93%	21%
SRR1868053	SRX912514	SRP055956	SAMN03383059	19,875,686	93%	21%
SRR1868054	SRX912515	SRP055956	SAMN03383060	16,889,397	88%	16%
SRR1868055	SRX912516	SRP055956	SAMN03383061	29,308,793	95%	24%
SRR1868056	SRX912517	SRP055956	SAMN03383062	30,077,415	95%	24%
SRR1868057	SRX912518	SRP055956	SAMN03383063	20,143,772	95%	24%
SRR1868058	SRX912519	SRP055956	SAMN03383064	11,864,554	95%	23%
SRR1868059	SRX912520	SRP055956	SAMN03383065	14,381,074	93%	23%
SRR1868060	SRX912521	SRP055956	SAMN03383066	24,412,439	94%	23%
SRR1868061	SRX912522	SRP055956	SAMN03383067	21,266,057	95%	24%
SRR1868062	SRX912523	SRP055956	SAMN03383068	19,236,199	92%	21%
SRR1868063	SRX912524	SRP055956	SAMN03383069	23,101,696	94%	22%
SRR1868064	SRX912525	SRP055956	SAMN03383070	17,655,726	93%	22%
SRR1868065	SRX912526	SRP055956	SAMN03383071	20,677,354	92%	20%
SRR1868066	SRX912527	SRP055956	SAMN03383072	17,418,237	93%	22%
SRR1868067	SRX912528	SRP055956	SAMN03383073	11,868,065	89%	18%
SRR2033954	SRX1034178	SRP058527	SAMN03702817	16,493,299	80%	26%
SRR2033955	SRX1034179	SRP058527	SAMN03702818	19,272,053	82%	26%
SRR2033956	SRX1034180	SRP058527	SAMN03702819	13,643,519	79%	22%
SRR2033957	SRX1034181	SRP058527	SAMN03702820	45,850,200	78%	24%
SRR2033958	SRX1034182	SRP058527	SAMN03702821	15,625,259	87%	26%
SRR2033959	SRX1034183	SRP058527	SAMN03702822	39,933,397	75%	26%
SRR2039795	SRX1038187	SRP058710	SAMN03734509	19,625,903	92%	28%
SRR2039796	SRX1038188	SRP058710	SAMN03734510	18,123,255	92%	26%
SRR2039797	SRX1038189	SRP058710	SAMN03734511	14,561,819	87%	26%
SRR2039798	SRX1038190	SRP058710	SAMN03734512	35,722,008	94%	25%
SRR2039799	SRX1038191	SRP058710	SAMN03734513	33,330,962	91%	24%
SRR3020583	SRX1486831	SRP067456	SAMN04346888	158,978,414	79%	24%
SRR3020584	SRX1486832	SRP067456	SAMN04346889	130,645,666	60%	27%
SRR3020589	SRX1486837	SRP067456	SAMN04346893	151,442,252	61%	24%
SRR3020590	SRX1486838	SRP067456	SAMN04346894	141,685,822	71%	23%
SRR3020585	SRX1486833	SRP067456	SAMN04346895	189,873,038	64%	27%
SRR3020595	SRX1486843	SRP067456	SAMN04346900	40,410,108	84%	28%
SRR3020598	SRX1486846	SRP067456	SAMN04346903	136,403,412	87%	26%
SRR3020579	SRX1486827	SRP067456	SAMN04346966	102,211,464	72%	21%
SRR3020580	SRX1486828	SRP067456	SAMN04346967	44,463,478	84%	27%
SRR3020581	SRX1486829	SRP067456	SAMN04346968	202,747,630	66%	20%
SRR3020582	SRX1486830	SRP067456	SAMN04346969	123,663,638	61%	25%
SRR3993764	SRX1994955	SRP080799	SAMN05503925	22,559,640	89%	27%
SRR3993765	SRX1994956	SRP080799	SAMN05503926	15,137,094	75%	26%
SRR3993766	SRX1994957	SRP080799	SAMN05503927	18,294,896	91%	27%
SRR3993767	SRX1994958	SRP080799	SAMN05503928	18,235,228	90%	28%

Protein alignments

Source	Number of sequences retrieved from Entrez	Number (%) of sequences aligned by ProSplign	Number (%) of sequences passed to Gnomon	Average % identity	Average % coverage
Brassicaceae GenBank	6,849	6,658 (97.21%)	6,658 (97.21%)	74.21%	85.67%
Brassicaceae known RefSeq (NP_)	857	851 (99.30%)	851 (99.30%)	72.94%	84.19%
Arabidopsis thaliana GenBank	53,516	52,419 (97.95%)	52,419 (97.95%)	77.66%	87.78%
Arabidopsis thaliana known RefSeq (NP_)	48,148	46,826 (97.25%)	46,826 (97.25%)	75.54%	85.84%
Same-species GenBank	4	4 (100.00%)	4 (100.00%)	73.72%	91.09%

Comparison of the current and previous annotations

The annotation produced for this release (101) was compared to the annotation in the previous release for each assembly annotated in both releases. Scores for current and previous gene and transcript features were calculated based on overlap in exon sequence and matches in exon boundaries. Pairs of current and previous features were categorized based on these scores, whether they are reciprocal best matches, and changes in attributes (gene biotype, completeness, etc.). If the assembly was updated between the two releases, alignments between the current and the previous assembly were used to match the current and previous gene and transcript features in mapped regions.

The table below summarizes the changes in the gene set for each assembly as a percent of the number of genes in the current annotation release, and provides links to the details of the comparison in tabular format and in a Genome Workbench project.

	v.1.0 (Current) to v.1.0 (Previous)
Identical	<1%
Minor changes	47%
Major changes	33%
New	20%
Deprecated	16%
Other	1%
Download the report	tabular, Genome Workbench

References

RefSeq: Pruitt KD, Brown GR, Hiatt SM, Thibaud-Nissen F, Astashyn A, Ermolaeva O, Farrell CM, Hart J, Landrum MJ, McGarvey KM, Murphy MR, O'Leary NA, Pujar S, Rajput B, Rangwala SH, Riddick LD, Shkeda A, Sun H, Tamez P, Tully RE, Wallin C, Webb D, Weber J, Wu W, Dicuccio M, Kitts P, Maglott DR, Murphy TD, Ostell JM. Nucleic Acids Research 2014, 42(Database issue):D756-63
RepeatMasker: Smit AFA, Hubley R, Green P. RepeatMasker Open-3.0. 1996–2004. http://www.repeatmasker.org
WindowMasker: Morgulis A, Gertz EM, Schäffer AA, Agarwala R. Bioinformatics 2006, 2:134-41
Splign: Kapustin Y, Souvorov A, Tatusova T, Lipman D. Biology Direct 2008, 3:20

RefSeq

Integrated reference sequences