CPP_DOC/doxyhtml/capitalization__string_8cpp_source.html

 /*  $Id: capitalization_string.cpp 102169 2024-04-09 14:42:19Z asztalos $

 * ===========================================================================

 *

 *                            PUBLIC DOMAIN NOTICE

 *               National Center for Biotechnology Information

 *

 *  This software/database is a "United States Government Work" under the

 *  terms of the United States Copyright Act.  It was written as part of

 *  the author's official duties as a United States Government employee and

 *  thus cannot be copyrighted.  This software/database is freely available

 *  to the public for use. The National Library of Medicine and the U.S.

 *  Government have not placed any restriction on its use or reproduction.

 *

 *  Although all reasonable efforts have been taken to ensure the accuracy

 *  and reliability of the software and data, the NLM and the U.S.

 *  Government do not and cannot warrant the performance or results that

 *  may be obtained by using this software or data. The NLM and the U.S.

 *  Government disclaim all warranties, express or implied, including

 *  warranties of performance, merchantability or fitness for any particular

 *  purpose.

 *

 *  Please cite the author in any work or product based on this material.

 *

 * ===========================================================================

 *

 * Author:  Andrea Asztalos, Igor Filippov

 *

 * File Description:

 *   Implement capitalization change in strings.

 */


 #include <ncbi_pch.hpp>

 #include <corelib/ncbistd.hpp>

 #include <objmgr/bioseq_ci.hpp>

 #include <objmgr/seqdesc_ci.hpp>

 #include <objects/seqfeat/BioSource.hpp>

 #include <objects/biblio/Auth_list.hpp>


 #include <util/xregexp/regexp.hpp>

 #include <objtools/cleanup/capitalization_string.hpp>


 BEGIN_NCBI_SCOPE

 BEGIN_SCOPE(objects)


 static const SStaticPair<const char*, const char*> set_abbreviation_list[] =

 {

     {"\\barabidopsis thaliana\\b","Arabidopsis thaliana"},

     {"\\badp\\b", "ADP" },

     {"\\batp\\b", "ATP" },

     {"\\bbac\\b", "BAC" },

     {"\\bcaenorhabditis elegans\\b", "Caenorhabditis elegans" },

     {"\\bcdna\\b", "cDNA" },

     {"\\bcdnas\\b", "cDNAs" },

     {"\\bcoa\\b", "CoA" },

     {"\\bcoi\\b", "COI" },

     {"\\bcoii\\b", "COII" },

     {"\\bdanio rerio\\b", "Danio rerio" },

     {"\\bdna\\b", "DNA" },

     {"\\bdrosophila melanogaster\\b", "Drosophila melanogaster" },

     {"\\bdsrna\\b", "dsRNA" },

     {"\\bescherichia coli\\b", "Escherichia coli" },

     {"\\bhiv\\b", "HIV" },

     {"\\bhiv\\-1\\b", "HIV-1" },

     {"\\bhiv\\-2\\b", "HIV-2" },

     {"\\bhnrna\\b", "hnRNA" },

     {"\\bhomo sapiens\\b", "Homo sapiens" },

     {"\\bmhc\\b", "MHC" },

     {"\\bmrna\\b", "mRNA" },

     {"\\bmtdna\\b", "mtDNA" },

     {"\\bmus musculus\\b", "Mus musculus" },

     {"\\bnadh\\b", "NADH" },

     {"\\bnov\\.\\b", "nov." },

     {"\\bnov\\.\\.\\b", "nov.." },

     {"\\bpcr\\b", "PCR" },

     {"\\brattus norvegicus\\b", "Rattus norvegicus" },

     {"\\brapd\\b", "RAPD" },

     {"\\brdna\\b", "rDNA" },

     {"\\brna\\b", "RNA" },

     {"\\brrna\\b", "rRNA" },

     {"\\brt\\-pcr\\b", "RT-PCR" },

     {"\\bsaccharomyces cerevisiae\\b", "Saccharomyces cerevisiae" },

     {"\\bscrna\\b", "scRNA" },

     {"\\bsiv\\-1\\b", "SIV-1" },

     {"\\bsnp\\b", "SNP"     },

     {"\\bsnps\\b", "SNPs"   },

     {"\\bsnrna\\b", "snRNA" },

     {"\\bsp\\.\\b", "sp." },

     {"\\bsp\\.\\.\\b", "sp.." },

     {"\\bssp\\.\\b", "ssp." },

     {"\\bssp\\.\\.\\b", "ssp.." },

     {"\\bssrna\\b", "ssRNA" },

     {"\\bsubsp\\.\\b", "subsp." },

     {"\\bsubsp\\.\\.\\b", "subsp.." },

     {"\\btrna\\b", "tRNA" },

     {"\\bvar\\.\\b", "var." },

     {"\\bvar\\.\\.\\b", "var.." },

     {"\\buk\\b", "UK" },

     {"\\busa\\b", "USA" },

     {"\\bU\\.S\\.A\\.\\b", "USA" },

     {"\\bU\\.S\\.A\\b", "USA" },

     {"\\bUnited States of America\\b", "USA" },

     {"\\b\\(hiv\\)\\b", "(HIV)" },

     {"\\b\\(hiv1\\)\\b", "(HIV1)" },

     {"\\b\\(hiv\\-1\\)\\b", "(HIV-1)"},


     {"\0","\0"}

 };


 static const SStaticPair<const char*, const char*> set_abbreviation_list_end_of_sentence[] =

 {

     {"\\bsp\\.$", "sp.." },

     {"\\bnov\\.$", "nov.." },

     {"\\bssp\\.$", "ssp.." },

     {"\\bvar\\.$", "var.." },

     {"\\bsubsp\\.$", "subsp.."},

     {"\0","\0"}

 };


 static const SStaticPair<const char*, const char*> map_state_to_abbrev[] =

 {

 { "ala", "AL"},

 { "alabama", "AL"},

 { "alas", "AK"},

 { "alaska", "AK"},

 { "ariz", "AZ"},

 { "arizona", "AZ"},

 { "ark", "AR"},

 { "arkansas", "AR"},

 { "cal", "CA"},

 { "cali", "CA"},

 { "calif", "CA"},

 { "california", "CA"},

 { "col", "CO"},

 { "colo", "CO"},

 { "colorado", "CO"},

 { "conn", "CT"},

 { "connecticut", "CT"},

 { "del", "DE"},

 { "delaware", "DE"},

 { "fla", "FL"},

 { "florida", "FL"},

 { "georgia", "GA"},

 { "hawaii", "HI"},

 { "ida", "ID"},

 { "idaho", "ID"},

 { "ill", "IL"},

 { "illinois", "IL"},

 { "ind", "IN"},

 { "indiana", "IN"},

 { "iowa", "IA"},

 { "kan", "KS"},

 { "kans", "KS"},

 { "kansas", "KS"},

 { "ken", "KY"},

 { "kent", "KY"},

 { "kentucky", "KY"},

 { "louisiana", "LA"},

 { "maine", "ME"},

 { "maryland", "MD"},

 { "mass", "MA"},

 { "massachusetts", "MA"},

 { "mich", "MI"},

 { "michigan", "MI"},

 { "minn", "MN"},

 { "minnesota", "MN"},

 { "miss", "MS"},

 { "mississippi", "MS"},

 { "missouri", "MO"},

 { "mont", "MT"},

 { "montana", "MT"},

 { "n car", "NC"},

 { "n dak", "ND"},

 { "neb", "NE"},

 { "nebr", "NE"},

 { "nebraska", "NE"},

 { "nev", "NV"},

 { "nevada", "NV"},

 { "new hampshire", "NH"},

 { "new jersey", "NJ"},

 { "new mexico", "NM"},

 { "new york", "NY"},

 { "north carolina", "NC"},

 { "north dakota", "ND"},

 { "ohio", "OH"},

 { "okla", "OK"},

 { "oklahoma", "OK"},

 { "ore", "OR"},

 { "oreg", "OR"},

 { "oregon", "OR"},

 { "penn", "PA"},

 { "penna", "PA"},

 { "pennsylvania", "PA"},

 { "puerto rico", "PR"},

 { "rhode island", "RI"},

 { "s car", "SC"},

 { "s dak", "SD"},

 { "south carolina", "SC"},

 { "south dakota", "SD"},

 { "tenn", "TN"},

 { "tennessee", "TN"},

 { "tex", "TX"},

 { "texas", "TX"},

 { "utah", "UT"},

 { "vermont", "VT"},

 { "virg", "VA"},

 { "virginia", "VA"},

 { "wash", "WA"},

 { "washington", "WA"},

 { "west virginia", "WV"},

 { "wis", "WI"},

 { "wisc", "WI"},

 { "wisconsin", "WI"},

 { "wyo", "WY"},

 { "wyoming", "WY"}


 };


 static const string mouse_strain_fixes[] = {

     "129/Sv" ,

     "129/SvJ" ,

     "BALB/c" ,

     "C57BL/6" ,

     "C57BL/6J" ,

     "CD-1" ,

     "CZECHII" ,

     "FVB/N",

     "FVB/N-3" ,

     "ICR" ,

     "NMRI" ,

     "NOD" ,

     "C3H" ,

     "C57BL" ,

     "C57BL/6" ,

     "C57BL/6J" ,

     "DBA/2"

 };


 typedef CStaticPairArrayMap<const char*, const char*, PCase_CStr> TCStringPairsMap;

 DEFINE_STATIC_ARRAY_MAP(TCStringPairsMap,k_state_abbrev, map_state_to_abbrev);


 MAKE_CONST_MAP(Canada_map_state_to_abbrev, ct::tagStrNocase, ct::tagStrNocase,

 {

     { "alberta", "AB"},

     { "british columbia", "BC"},

     { "manitoba", "MB"},

     { "new brunswick", "NB"},

     { "newfoundland and labrador", "NL"},

     { "northwest territories", "NT"},

     { "nova scotia", "NS"},

     { "nunavut", "NU"},

     { "ontario", "ON"},

     { "prince edward island", "PE"},

     { "quebec", "QC"},

     { "saskatchewan", "SK"},

     { "yukon", "YT"}

 });


 static const SStaticPair<const char*, const char*> set_short_words[] =

 {

     {"\\bA\\b", "a" },

     {"\\bAbout\\b", "about" },

     {"\\bAnd\\b", "and" },

     {"\\bAt\\b", "at" },

     {"\\bBut\\b", "but" },

     {"\\bBy\\b", "by" },

     {"\\bFor\\b", "for" },

     {"\\bIn\\b", "in" },

     {"\\bIs\\b", "is" },

     {"\\bOf\\b", "of" },

     {"\\bOn\\b", "on" },

     {"\\bOr\\b", "or" },

     {"\\bThe\\b", "the" },

     {"\\bTo\\b", "to" },

     {"\\bWith\\b", "with" },

     {"\0","\0"}

 };


 static const SStaticPair<const char*, const char*> set_country_fixes[] =

 {


     {"\\bchnia\\b", "China" },

     {"\\bpr china\\b", "P.R. China" },

     {"\\bprchina\\b", "P.R. China" },

     {"\\bp\\.r\\.china\\b", "P.R. China" },

     {"\\bp\\.r china\\b", "P.R. China" },

     {"\\bp\\, r\\, china\\b", "P.R. China" },

     {"\\brok\\b", "ROK" },

     {"\\brsa\\b", "RSA" },

     {"\\broc\\b", "ROC" },

     {"\\buae\\b", "UAE" },

     {"\\bK\\.S\\.A\\.\\b", "K.S.A." },

     {"\\bk\\. s\\. a\\.\\b", "K. S. A." },

     {"\\bksa\\b", "KSA" },

     {"\0","\0"}

 };


 static const SStaticPair<const char*, const char*> set_AffiliationShortWordList[] =

 {

     {"\\bAu\\b", "au" },

     {"\\bAux\\b", "aux" },

     {"\\bA La\\b", "a la" },

     {"\\bDe La\\b", "de la" },

     {"\\bDe\\b", "de" },

     {"\\bDel\\b", "del"},

     {"\\bDes\\b", "des" },

     {"\\bDu\\b", "du" },

     {"\\bEt\\b", "et" },

     {"\\bLa\\b", "la" },

     {"\\bLe\\b", "le" },

     {"\\bLes\\b", "les" },

     {"\\bRue\\b", "rue" },

     {"\\bPo Box\\b", "PO Box" },

     {"\\bPobox\\b", "PO Box" },

     {"\\bP\\.O box\\b", "P.O. Box" },

     {"\\bP\\.Obox\\b", "P.O. Box" },

     {"\\bY\\b", "y" },

     {"\\bA\\&F\\b", "A&F" },    // Northwest A&F University

     {"\0","\0"}

 };


 static const char* set_ordinal_endings[] =

 {

     "\\dth\\b",

     "\\dst\\b",

     "\\dnd\\b",

     "\\drd\\b",

     "\0"

 };


 static const SStaticPair<const char*, const char*> set_KnownAbbreviationList[] =

 {

     {"\\bpo box\\b", "PO Box" },

     {"\\bPobox\\b", "PO Box" },

     {"\\bP\\.O box\\b", "P.O. Box" },

     {"\\bP\\.Obox\\b", "P.O. Box" },

     {"\\bPO\\.Box\\b", "P.O. Box" },

     {"\\bPO\\. Box\\b", "P.O. Box" },

     {"\\bpr china\\b", "P.R. China"},

     {"\\bprchina\\b", "P.R. China" },

     {"\\bp\\.r\\.china\\b", "P.R. China" },

     {"\\bp\\.r china\\b", "P.R. China" },

     {"\\bp\\, r\\, china\\b", "P.R. China" },

     {"\\bp\\,r\\, china\\b", "P.R. China" },

     {"\\bp\\,r\\,china\\b", "P.R. China" },

     {"\0","\0"}  // end of array

 };


 const string& GetValidCountryCode(unsigned int i)

 {

     static vector<string> set_valid_country_codes

     {

       "Afghanistan",

       "Albania",

       "Algeria",

       "American Samoa",

       "Andorra",

       "Angola",

       "Anguilla",

       "Antarctica",

       "Antigua and Barbuda",

       "Arctic Ocean",

       "Argentina",

       "Armenia",

       "Aruba",

       "Ashmore and Cartier Islands",

       "Atlantic Ocean",

       "Australia",

       "Austria",

       "Azerbaijan",

       "Bahamas",

       "Bahrain",

       "Baker Island",

       "Baltic Sea",

       "Bangladesh",

       "Barbados",

       "Bassas da India",

       "Belarus",

       "Belgium",

       "Belize",

       "Benin",

       "Bermuda",

       "Bhutan",

       "Bolivia",

       "Borneo",

       "Bosnia and Herzegovina",

       "Botswana",

       "Bouvet Island",

       "Brazil",

       "British Virgin Islands",

       "Brunei",

       "Bulgaria",

       "Burkina Faso",

       "Burundi",

       "Cambodia",

       "Cameroon",

       "Canada",

       "Cape Verde",

       "Cayman Islands",

       "Central African Republic",

       "Chad",

       "Chile",

       "China",

       "Christmas Island",

       "Clipperton Island",

       "Cocos Islands",

       "Colombia",

       "Comoros",

       "Cook Islands",

       "Coral Sea Islands",

       "Costa Rica",

       "Cote d'Ivoire",

       "Croatia",

       "Cuba",

       "Curacao",

       "Cyprus",

       "Czech Republic",

       "Democratic Republic of the Congo",

       "Denmark",

       "Djibouti",

       "Dominica",

       "Dominican Republic",

       "East Timor",

       "Ecuador",

       "Egypt",

       "El Salvador",

       "Equatorial Guinea",

       "Eritrea",

       "Estonia",

       "Ethiopia",

       "Europa Island",

       "Falkland Islands (Islas Malvinas)",

       "Faroe Islands",

       "Fiji",

       "Finland",

       "France",

       "French Guiana",

       "French Polynesia",

       "French Southern and Antarctic Lands",

       "Gabon",

       "Gambia",

       "Gaza Strip",

       "Georgia",

       "Germany",

       "Ghana",

       "Gibraltar",

       "Glorioso Islands",

       "Greece",

       "Greenland",

       "Grenada",

       "Guadeloupe",

       "Guam",

       "Guatemala",

       "Guernsey",

       "Guinea",

       "Guinea-Bissau",

       "Guyana",

       "Haiti",

       "Heard Island and McDonald Islands",

       "Honduras",

       "Hong Kong",

       "Howland Island",

       "Hungary",

       "Iceland",

       "India",

       "Indian Ocean",

       "Indonesia",

       "Iran",

       "Iraq",

       "Ireland",

       "Isle of Man",

       "Israel",

       "Italy",

       "Jamaica",

       "Jan Mayen",

       "Japan",

       "Jarvis Island",

       "Jersey",

       "Johnston Atoll",

       "Jordan",

       "Juan de Nova Island",

       "Kazakhstan",

       "Kenya",

       "Kerguelen Archipelago",

       "Kingman Reef",

       "Kiribati",

       "Kosovo",

       "Kuwait",

       "Kyrgyzstan",

       "Laos",

       "Latvia",

       "Lebanon",

       "Lesotho",

       "Liberia",

       "Libya",

       "Liechtenstein",

       "Line Islands",

       "Lithuania",

       "Luxembourg",

       "Macau",

       "Macedonia",

       "Madagascar",

       "Malawi",

       "Malaysia",

       "Maldives",

       "Mali",

       "Malta",

       "Marshall Islands",

       "Martinique",

       "Mauritania",

       "Mauritius",

       "Mayotte",

       "Mediterranean Sea",

       "Mexico",

       "Micronesia",

       "Midway Islands",

       "Moldova",

       "Monaco",

       "Mongolia",

       "Montenegro",

       "Montserrat",

       "Morocco",

       "Mozambique",

       "Myanmar",

       "Namibia",

       "Nauru",

       "Navassa Island",

       "Nepal",

       "Netherlands",

       "New Caledonia",

       "New Zealand",

       "Nicaragua",

       "Niger",

       "Nigeria",

       "Niue",

       "Norfolk Island",

       "North Korea",

       "North Sea",

       "Northern Mariana Islands",

       "Norway",

       "Oman",

       "Pacific Ocean",

       "Pakistan",

       "Palau",

       "Palmyra Atoll",

       "Panama",

       "Papua New Guinea",

       "Paracel Islands",

       "Paraguay",

       "Peru",

       "Philippines",

       "Pitcairn Islands",

       "Poland",

       "Portugal",

       "Puerto Rico",

       "Qatar",

       "Republic of the Congo",

       "Reunion",

       "Romania",

       "Ross Sea",

       "Russia",

       "Rwanda",

       "Saint Helena",

       "Saint Kitts and Nevis",

       "Saint Lucia",

       "Saint Pierre and Miquelon",

       "Saint Vincent and the Grenadines",

       "Samoa",

       "San Marino",

       "Sao Tome and Principe",

       "Saudi Arabia",

       "Senegal",

       "Serbia",

       "Seychelles",

       "Sierra Leone",

       "Singapore",

       "Sint Maarten",

       "Slovakia",

       "Slovenia",

       "Solomon Islands",

       "Somalia",

       "South Africa",

       "South Georgia and the South Sandwich Islands",

       "South Korea",

       "South Sudan",

       "Southern Ocean",

       "Spain",

       "Spratly Islands",

       "Sri Lanka",

       "Sudan",

       "Suriname",

       "Svalbard",

       "Swaziland",

       "Sweden",

       "Switzerland",

       "Syria",

       "Taiwan",

       "Tajikistan",

       "Tanzania",

       "Tasman Sea",

       "Thailand",

       "Togo",

       "Tokelau",

       "Tonga",

       "Trinidad and Tobago",

       "Tromelin Island",

       "Tunisia",

       "Turkey",

       "Turkmenistan",

       "Turks and Caicos Islands",

       "Tuvalu",

       "Uganda",

       "Ukraine",

       "United Arab Emirates",

       "United Kingdom",

       "Uruguay",

       "USA",

       "Uzbekistan",

       "Vanuatu",

       "Venezuela",

       "Viet Nam",

       "Virgin Islands",

       "Wake Island",

       "Wallis and Futuna",

       "West Bank",

       "Western Sahara",

       "Yemen",

       "Zambia",

       "Zimbabwe"

      };

     return (i < set_valid_country_codes.size()) ? set_valid_country_codes[i] : kEmptyStr;

 };


 void FixCapitalizationInString (CSeq_entry_Handle seh, string& str, ECapChange capchange_opt)

 {

     if (NStr::IsBlank(str) || capchange_opt == eCapChange_none) {

         return;

     } else {

         switch (capchange_opt) {

             case eCapChange_tolower:

                 NStr::ToLower(str);

                 FixAbbreviationsInElement(str,seh);

                 FixOrgNames(seh, str);

                 break;

             case eCapChange_toupper:

                 NStr::ToUpper(str);

                 FixAbbreviationsInElement(str,seh);

                 FixOrgNames(seh, str);

                 break;

             case eCapChange_firstcap_restlower:

                 NStr::ToLower(str);

                 if ( isalpha(str[0]) ) {

                     str[0] = toupper(str[0]);

                 }

                 FixAbbreviationsInElement(str,seh);

                 FixOrgNames(seh, str);

                 break;

             case eCapChange_firstcap_restnochange:

                 if ( isalpha(str[0]) ) {

                    str[0] = toupper(str[0]);

                 }

                 break;

             case eCapChange_firstlower_restnochange:

                 if ( isalpha(str[0]) ) {

                     str[0] = tolower(str[0]);

                 }

                 break;

             case eCapChange_capword_afterspace:

             case eCapChange_capword_afterspacepunc:

             {

                 NStr::ToLower(str);

                 vector<string> words;

                 NStr::Split(str, " \t\r\n", words);

                 for (vector<string>::iterator word = words.begin(); word != words.end(); ++word) {

                     if (!word->empty() && isalpha(word->at(0))) {

                         word->at(0) = toupper(word->at(0));

                     }

                 }

                 str = NStr::Join(words, " ");

                 if (capchange_opt == eCapChange_capword_afterspacepunc) {

                     bool found_punct = false;

                     for (SIZE_TYPE n = 0; n < str.size(); ++n) {

                         if (ispunct(str[n])) {

                             found_punct = true;

                         } else if (isalpha(str[n]) && found_punct) {

                             str[n] = toupper(str[n]);

                             found_punct = false;

                         }

                     }

                 }

                 FixAbbreviationsInElement(str,seh);

                 FixOrgNames(seh, str);

             }

                 break;

             default:

                 break;

         }

     }

 }


 void FixAbbreviationsInElement(string& result, bool fix_end_of_sentence)

 {

     for (int pat=0; set_abbreviation_list[pat].first[0]!='\0'; ++pat) {

         CRegexpUtil replacer( result );

         //int num_replacements =

         replacer.Replace( set_abbreviation_list[pat].first, set_abbreviation_list[pat].second,

             CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

     if (fix_end_of_sentence)

     {

         for (int pat=0; set_abbreviation_list_end_of_sentence[pat].first[0]!='\0'; ++pat) {

             CRegexpUtil replacer( result );

             replacer.Replace( set_abbreviation_list_end_of_sentence[pat].first, set_abbreviation_list_end_of_sentence[pat].second,

                               CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

             replacer.GetResult().swap( result );

         }

     }

 }


 static bool s_ReplaceInPlaceWholeWordNoCase(string& str, const string& search, const string& replace)

 {

     bool modified = false;


     size_t pos = NStr::FindNoCase(str, search);

     while (pos != string::npos) {

         size_t right_end = pos + search.length();

         if ((pos == 0 || !isalpha(str.c_str()[pos - 1]))

             && (right_end == str.length() || !isalpha(str.c_str()[right_end]))) {

                 string this_replace = replace;

                 str = str.substr(0, pos) + this_replace + str.substr(right_end);

                 right_end = pos + this_replace.length();

                 modified = true;

         }

         pos = NStr::FindNoCase(str, search, right_end);

     }


     return modified;

 }


 void FixOrgNames(CSeq_entry_Handle seh, string& result)

 {

     vector<string> taxnames;

     FindOrgNames(seh, taxnames);

     for (vector<string>::const_iterator name = taxnames.begin(); name != taxnames.end(); ++name) {

         bool modified = s_ReplaceInPlaceWholeWordNoCase(result, *name, *name);

         if (!modified && (NStr::Find(*name, "]") != NPOS || NStr::Find(*name, "[") != NPOS)) {

             string temp_taxname(*name);

             NStr::ReplaceInPlace(temp_taxname, "]", "");

             NStr::ReplaceInPlace(temp_taxname, "[", "");

             modified = s_ReplaceInPlaceWholeWordNoCase(result, temp_taxname, temp_taxname);

         }

     }

 }


 void FindOrgNames(CSeq_entry_Handle seh, vector<string>& taxnames)

 {

     if (!seh) return;

     set<string> names;

     CBioseq_CI b_iter(seh, CSeq_inst::eMol_na);

     for ( ; b_iter ; ++b_iter ) {

         CSeqdesc_CI it (*b_iter, CSeqdesc::e_Source);

         if (it && it->GetSource().IsSetTaxname()) {

             auto& tax_name = it->GetSource().GetTaxname();

             if (!NStr::IsBlank(tax_name)) {

                 names.insert(tax_name);

             }

         }

     }

     taxnames.assign(names.begin(), names.end());

 }


 void RemoveFieldNameFromString( const string& field_name, string& str)

 {

     if (NStr::IsBlank(field_name) || NStr::IsBlank(str)) {

         return;

     }


     NStr::TruncateSpacesInPlace(str);

     if (NStr::StartsWith(str, field_name, NStr::eNocase) && str.length() > field_name.length()

         && str[field_name.length()] == ' ') {

         NStr::ReplaceInPlace(str, field_name, kEmptyStr, 0, 1);

         NStr::TruncateSpacesInPlace(str);

     }

 }


 void GetStateAbbreviation(string& state)

 {

     NStr::ReplaceInPlace (state, "  ", " ");

     NStr::TruncateSpacesInPlace (state);

     TCStringPairsMap::const_iterator found = k_state_abbrev.find(NStr::ToLower(state).c_str());

     if (found != k_state_abbrev.end())

         state = found->second;

     else

         NStr::ToUpper(state);

 }


 void GetCanadaStateAbbreviation(string& state)

 {

     NStr::ReplaceInPlace(state, "  ", " ");

     NStr::TruncateSpacesInPlace(state);

     auto found = Canada_map_state_to_abbrev.find(state);

     if (found != Canada_map_state_to_abbrev.end())

         state = found->second;

     else

         NStr::ToUpper(state);

 }


 bool FixStateAbbreviationsInCitSub(CCit_sub& sub)

 {

     bool modified = false;

     if (sub.IsSetAuthors() && sub.GetAuthors().IsSetAffil() && sub.GetAuthors().GetAffil().IsStd()) {

         modified |= FixUSAAbbreviationInAffil(sub.SetAuthors().SetAffil());

         modified |= FixStateAbbreviationsInAffil(sub.SetAuthors().SetAffil());

     }

     return modified;

 }


 bool FixUSAAbbreviationInAffil(CAffil& affil)

 {

     if (affil.IsStd() && affil.GetStd().IsSetCountry()) {

         CAffil::C_Std& std = affil.SetStd();

         string country = std.GetCountry();

         NStr::ReplaceInPlace(country, "  ", " ");

         NStr::TruncateSpacesInPlace(country);


         if (NStr::CompareNocase(country, "United States of America") == 0 ||

             NStr::CompareNocase(country, "United States") == 0 ||

             NStr::CompareNocase(country, "U.S.A.") == 0 ||

             NStr::CompareNocase(country, "U S A") == 0 ||

             NStr::CompareNocase(country, "US") == 0)

         {

             std.SetCountry("USA");

             return true;

         }

     }

     return false;

 }


 bool FixStateAbbreviationsInAffil(CAffil& affil)

 {

     if (affil.IsStd()) {

         CAffil::C_Std& std = affil.SetStd();

         if (std.IsSetCountry() && NStr::EqualCase(std.GetCountry(), "USA")) {

             if (std.IsSetSub() && !NStr::IsBlank(std.GetSub())) {

                 string state = std.GetSub();

                 GetStateAbbreviation(state); // update the state abbreviation

                 if (!NStr::IsBlank(state) && !NStr::EqualCase(std.GetSub(), state)) {

                     std.SetSub(state);

                     return true;

                 }

             }

         }

     }

     return false;

 }


 bool FixupMouseStrain(string& strain)

 {

     if (NStr::IsBlank(strain))

         return false;


     NStr::TruncateSpacesInPlace (strain);


     bool whole_word = true;

     for (unsigned int i = 0; i < sizeof(mouse_strain_fixes)/sizeof(mouse_strain_fixes[0]); ++i) {

         CRegexpUtil replacer(strain);

         string pattern = whole_word ? ("\\b" + mouse_strain_fixes[i] + "\\b") : mouse_strain_fixes[i];

         // whole-word and case insensitive search

         if (replacer.Replace(pattern, mouse_strain_fixes[i], CRegexp::fCompile_ignore_case) > 0) {

             replacer.GetResult().swap(strain);

             return true;

         }

     }

     return false;

 }


 void InsertMissingSpacesAfterCommas(string& result)

 {

     CRegexpUtil replacer( result );

     replacer.Replace( "\\,(\\S)", ", $1", CRegexp::fCompile_default, CRegexp::fMatch_default, 0);

     replacer.GetResult().swap( result );

 }


 void InsertMissingSpacesAfterNo(string& result)

 {

     CRegexpUtil replacer( result );

     replacer.Replace( "No\\.(\\w)", "No. $1", CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

     replacer.GetResult().swap( result );

 }


 void FixCapitalizationInElement(string& result)

 {

     result = NStr::ToLower(result);

     bool capitalize = true;

     for (unsigned int i=0; i<result.size(); i++)

     {

         char &a = result.at(i);

         if (isalpha(a))

         {

             if (capitalize)

                 a = toupper(a);

             capitalize = false;

         }

         else if (a != '\'')

             capitalize = true;

     }

 }


 void FixShortWordsInElement(string& result)

 {

     for (int pat=0; set_short_words[pat].first[0]!='\0'; ++pat)

     {

         CRegexpUtil replacer( result );

         replacer.Replace( set_short_words[pat].first, set_short_words[pat].second, CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

     result.at(0) = toupper(result.at(0));

 }


 void FindReplaceString_CountryFixes(string& result)

 {

     for (int pat=0; set_country_fixes[pat].first[0] != '\0'; ++pat)

     {

         CRegexpUtil replacer( result );

         replacer.Replace( set_country_fixes[pat].first, set_country_fixes[pat].second, CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

 }


 void CapitalizeAfterApostrophe(string& input)

 {

     string result;

     CRegexp pattern("\\'\\w");

     size_t start = 0;

     for (;;) {

         pattern.GetMatch(input, start, 0, CRegexp::fMatch_default, true);

         if (pattern.NumFound() > 0) {

             const auto* rslt = pattern.GetResults(0);

             if (rslt[0] != start)

                 result += input.substr(start,rslt[0]-start);

             string tmp = input.substr(rslt[0], rslt[1] - rslt[0]);

             result += NStr::ToUpper(tmp);

             start = rslt[1];

         } else {

             result += input.substr(start,input.length()-start);

             break;

         }

     }

     input = result;

 }


 void FixAffiliationShortWordsInElement(string& result)

 {

     if (result.empty()) return;

     for (int pat=0; set_AffiliationShortWordList[pat].first[0]!='\0'; ++pat)

     {

         CRegexpUtil replacer( result );

         //int num_replacements =

         replacer.Replace( set_AffiliationShortWordList[pat].first,

             set_AffiliationShortWordList[pat].second, CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

     result.at(0) = toupper(result.at(0));

     // fix d'

     {

         CRegexpUtil replacer( result );

         //int num_replacements =

         replacer.Replace( "\\bD\\'", "d'", CRegexp::fCompile_default, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );


         string temp;

         CRegexp pattern("\\bd\\'\\w");

         size_t start = 0;

         for (;;) {

             pattern.GetMatch(result, start, 0, CRegexp::fMatch_default, true);

             if (pattern.NumFound() > 0) {

                 const auto* rslt = pattern.GetResults(0);

                 if (rslt[0] != start)

                     temp += result.substr(start,rslt[0]-start);

                 string tmp = result.substr(rslt[0], rslt[1] - rslt[0]);

                 tmp = NStr::ToUpper(tmp);

                 tmp.at(0) = 'd';

                 temp += tmp;

                 start = rslt[1];

             } else {

                 temp += result.substr(start,result.length()-start);

                 break;

             }

         }

         result = temp;

     }

 }


 void FixOrdinalNumbers(string& result)

 {

     for(int p = 0; set_ordinal_endings[p][0] != '\0'; ++p)

     {

         CRegexp pattern(set_ordinal_endings[p],CRegexp::fCompile_ignore_case);

         string temp;

         size_t start = 0;

         for (;;) {

             pattern.GetMatch(result, start, 0, CRegexp::fMatch_default, true);

             if (pattern.NumFound() > 0) {

                 const auto* rslt = pattern.GetResults(0);

                 if (rslt[0] != start)

                     temp += result.substr(start,rslt[0]-start);

                 string tmp = result.substr(rslt[0], rslt[1] - rslt[0]);

                 tmp = NStr::ToLower(tmp);

                 temp += tmp;

                 start = rslt[1];

             } else {

                 temp += result.substr(start,result.length()-start);

                 break;

             }

         }

         result = temp;

     }

 }


 void FixKnownAbbreviationsInElement(string& result)

 {

     if (result.empty()) return;

     for (int pat=0; set_KnownAbbreviationList[pat].first[0] != '\0' ; ++pat)

     {

         CRegexpUtil replacer( result );

         //int num_replacements =

         replacer.Replace( set_KnownAbbreviationList[pat].first, set_KnownAbbreviationList[pat].second, CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

 }


 void CapitalizeSAfterNumber(string& result)

 {

     CRegexpUtil replacer( result );

     //int num_replacements =

     replacer.Replace( "(\\d)s\\b", "$1S", CRegexp::fCompile_default, CRegexp::fMatch_default, 0);

     replacer.GetResult().swap( result );

 }


 void ResetCapitalization(string& result, bool first_is_upper)

 {


     if (result.empty()) return;


     bool was_digit = false;


     if (first_is_upper)

     {

         /* Set first character to upper */

         result[0] = toupper(result[0]);

     }

     else

     {

         /* set first character to lower */

         result[0] = tolower(result[0]);

     }


     if (isdigit ((Int4)(result[0])))

     {

         was_digit = true;

     }

     unsigned int i = 1;

   /* Set rest of characters to lower */

     while (i < result.size())

     {

         char &pCh = result[i];

         if (was_digit && (pCh == 'S' || pCh == 's') && (i+1 >= result.size()-1 || isspace(result[i+1])))

             {

                 pCh = toupper (pCh);

                 was_digit = false;

             }

             else if (isdigit (pCh))

             {

                 was_digit = true;

             }

             else

             {

                 was_digit = false;

                 pCh = tolower (pCh);

             }

             i++;

     }

 }


 void FixCountryCapitalization(string& result)

 {

     for(unsigned int p = 0; !GetValidCountryCode(p).empty(); ++p)

     {

         string name = GetValidCountryCode(p);

         CRegexpUtil replacer( result );

         replacer.Replace( "\\b"+name+"\\b", name, CRegexp::fCompile_ignore_case, CRegexp::fMatch_default, 0);

         replacer.GetResult().swap( result );

     }

 }


 END_SCOPE(objects)

 END_NCBI_SCOPE


Auth_list.hpp

BioSource.hpp

static
#define static
Definition: Genetic_code_table.cpp:681

bioseq_ci.hpp

FixupMouseStrain
bool FixupMouseStrain(string &strain)
This function does not check whether the taxname starts with "Mus musculus", it only corrects the mou...
Definition: capitalization_string.cpp:860

FindOrgNames
void FindOrgNames(CSeq_entry_Handle seh, vector< string > &taxnames)
Definition: capitalization_string.cpp:758

FixShortWordsInElement
void FixShortWordsInElement(string &result)
Definition: capitalization_string.cpp:912

FixAbbreviationsInElement
void FixAbbreviationsInElement(string &result, bool fix_end_of_sentence)
Definition: capitalization_string.cpp:703

RemoveFieldNameFromString
void RemoveFieldNameFromString(const string &field_name, string &str)
Definition: capitalization_string.cpp:775

FixStateAbbreviationsInAffil
bool FixStateAbbreviationsInAffil(CAffil &affil)
Definition: capitalization_string.cpp:842

InsertMissingSpacesAfterNo
void InsertMissingSpacesAfterNo(string &result)
Definition: capitalization_string.cpp:887

set_country_fixes
static const SStaticPair< const char *, const char * > set_country_fixes[]
Definition: capitalization_string.cpp:280

FixAffiliationShortWordsInElement
void FixAffiliationShortWordsInElement(string &result)
Definition: capitalization_string.cpp:956

FixCountryCapitalization
void FixCountryCapitalization(string &result)
Definition: capitalization_string.cpp:1089

set_AffiliationShortWordList
static const SStaticPair< const char *, const char * > set_AffiliationShortWordList[]
Definition: capitalization_string.cpp:299

GetStateAbbreviation
void GetStateAbbreviation(string &state)
Definition: capitalization_string.cpp:789

FindReplaceString_CountryFixes
void FindReplaceString_CountryFixes(string &result)
Definition: capitalization_string.cpp:924

mouse_strain_fixes
static const string mouse_strain_fixes[]
Definition: capitalization_string.cpp:218

CapitalizeAfterApostrophe
void CapitalizeAfterApostrophe(string &input)
Definition: capitalization_string.cpp:934

FixUSAAbbreviationInAffil
bool FixUSAAbbreviationInAffil(CAffil &affil)
Definition: capitalization_string.cpp:821

FixKnownAbbreviationsInElement
void FixKnownAbbreviationsInElement(string &result)
Definition: capitalization_string.cpp:1024

TCStringPairsMap
CStaticPairArrayMap< const char *, const char *, PCase_CStr > TCStringPairsMap
Definition: capitalization_string.cpp:238

InsertMissingSpacesAfterCommas
void InsertMissingSpacesAfterCommas(string &result)
Definition: capitalization_string.cpp:880

set_abbreviation_list_end_of_sentence
static const SStaticPair< const char *, const char * > set_abbreviation_list_end_of_sentence[]
Definition: capitalization_string.cpp:109

set_KnownAbbreviationList
static const SStaticPair< const char *, const char * > set_KnownAbbreviationList[]
Definition: capitalization_string.cpp:332

GetValidCountryCode
const string & GetValidCountryCode(unsigned int i)
Definition: capitalization_string.cpp:350

FixCapitalizationInString
void FixCapitalizationInString(CSeq_entry_Handle seh, string &str, ECapChange capchange_opt)
Definition: capitalization_string.cpp:636

CapitalizeSAfterNumber
void CapitalizeSAfterNumber(string &result)
Definition: capitalization_string.cpp:1036

FixStateAbbreviationsInCitSub
bool FixStateAbbreviationsInCitSub(CCit_sub &sub)
Definition: capitalization_string.cpp:811

FixCapitalizationInElement
void FixCapitalizationInElement(string &result)
Definition: capitalization_string.cpp:894

set_abbreviation_list
static const SStaticPair< const char *, const char * > set_abbreviation_list[]
Definition: capitalization_string.cpp:45

set_short_words
static const SStaticPair< const char *, const char * > set_short_words[]
Definition: capitalization_string.cpp:259

DEFINE_STATIC_ARRAY_MAP
DEFINE_STATIC_ARRAY_MAP(TCStringPairsMap, k_state_abbrev, map_state_to_abbrev)

MAKE_CONST_MAP
MAKE_CONST_MAP(Canada_map_state_to_abbrev, ct::tagStrNocase, ct::tagStrNocase, { { "alberta", "AB"}, { "british columbia", "BC"}, { "manitoba", "MB"}, { "new brunswick", "NB"}, { "newfoundland and labrador", "NL"}, { "northwest territories", "NT"}, { "nova scotia", "NS"}, { "nunavut", "NU"}, { "ontario", "ON"}, { "prince edward island", "PE"}, { "quebec", "QC"}, { "saskatchewan", "SK"}, { "yukon", "YT"} })

map_state_to_abbrev
static const SStaticPair< const char *, const char * > map_state_to_abbrev[]
Definition: capitalization_string.cpp:119

GetCanadaStateAbbreviation
void GetCanadaStateAbbreviation(string &state)
Definition: capitalization_string.cpp:800

FixOrgNames
void FixOrgNames(CSeq_entry_Handle seh, string &result)
Definition: capitalization_string.cpp:743

FixOrdinalNumbers
void FixOrdinalNumbers(string &result)
Definition: capitalization_string.cpp:998

set_ordinal_endings
static const char * set_ordinal_endings[]
Definition: capitalization_string.cpp:323

ResetCapitalization
void ResetCapitalization(string &result, bool first_is_upper)
Definition: capitalization_string.cpp:1044

s_ReplaceInPlaceWholeWordNoCase
static bool s_ReplaceInPlaceWholeWordNoCase(string &str, const string &search, const string &replace)
Definition: capitalization_string.cpp:723

CAffil_Base::C_Std
std representation
Definition: Affil_.hpp:91

CAffil
@Affil.hpp User-defined methods of the data storage class.
Definition: Affil.hpp:56

CBioSource::GetTaxname
const string & GetTaxname(void) const
Definition: BioSource.cpp:340

CBioSource::IsSetTaxname
bool IsSetTaxname(void) const
Definition: BioSource.cpp:335

CBioseq_CI
CBioseq_CI –.
Definition: bioseq_ci.hpp:69

CCit_sub
Definition: Cit_sub.hpp:53

CRegexpUtil
CRegexpUtil –.
Definition: regexp.hpp:312

CRegexp
CRegexp –.
Definition: regexp.hpp:70

CSeq_entry_Handle
CSeq_entry_Handle –.
Definition: seq_entry_handle.hpp:107

CSeqdesc_CI
CSeqdesc_CI –.
Definition: seqdesc_ci.hpp:65

CStaticPairArrayMap
class CStaticArrayMap<> is an array adaptor that provides an STLish interface to statically-defined a...
Definition: static_map.hpp:105

CStaticPairArrayMap::const_iterator
TBase::const_iterator const_iterator
Definition: static_map.hpp:109

set< string >

state
Definition: sls_alp.hpp:60

capitalization_string.hpp

ECapChange
ECapChange
Definition: capitalization_string.hpp:41

eCapChange_firstlower_restnochange
@ eCapChange_firstlower_restnochange
capitalize the first letter, the rest is not changed
Definition: capitalization_string.hpp:47

eCapChange_capword_afterspacepunc
@ eCapChange_capword_afterspacepunc
capitalize the first letter and letters after spaces
Definition: capitalization_string.hpp:49

eCapChange_none
@ eCapChange_none
Definition: capitalization_string.hpp:42

eCapChange_capword_afterspace
@ eCapChange_capword_afterspace
first letter is lower case, the rest is not changed
Definition: capitalization_string.hpp:48

eCapChange_firstcap_restnochange
@ eCapChange_firstcap_restnochange
capitalize the first letter, the rest is lower case
Definition: capitalization_string.hpp:46

eCapChange_firstcap_restlower
@ eCapChange_firstcap_restlower
change each letter to upper case
Definition: capitalization_string.hpp:45

eCapChange_tolower
@ eCapChange_tolower
no change
Definition: capitalization_string.hpp:43

eCapChange_toupper
@ eCapChange_toupper
change each letter to lower case
Definition: capitalization_string.hpp:44

ncbistd.hpp
Include a standard set of the NCBI C++ Toolkit most basic headers.

names
static const struct name_t names[]

first
static DLIST_TYPE *DLIST_NAME() first(DLIST_LIST_TYPE *list)
Definition: dlist.tmpl.h:46

str
static const char * str(char *buf, int n)
Definition: stats.c:84

tmp
static char tmp[3200]
Definition: utf8.c:42

Int4
int32_t Int4
4-byte (32-bit) signed integer
Definition: ncbitype.h:102

CRegexp::GetResults
const TOffset * GetResults(size_t idx) const
Get location of pattern/subpattern for the last GetMatch().
Definition: regexp.hpp:569

CRegexp::GetMatch
CTempString GetMatch(CTempString str, size_t offset=0, size_t idx=0, TMatch flags=fMatch_default, bool noreturn=false)
Get matching pattern and subpatterns.
Definition: regexp.cpp:182

CRegexpUtil::Replace
size_t Replace(CTempStringEx search, CTempString replace, CRegexp::TCompile compile_flags=CRegexp::fCompile_default, CRegexp::TMatch match_flags=CRegexp::fMatch_default, size_t max_replace=0)
Replace occurrences of a substring within a string by pattern.
Definition: regexp.cpp:289

CRegexp::NumFound
int NumFound() const
Get number of patterns + subpatterns.
Definition: regexp.hpp:562

CRegexpUtil::GetResult
string GetResult(void)
Get result string.
Definition: regexp.hpp:582

CRegexp::fCompile_default
@ fCompile_default
Definition: regexp.hpp:102

CRegexp::fCompile_ignore_case
@ fCompile_ignore_case
Definition: regexp.hpp:103

CRegexp::fMatch_default
@ fMatch_default
Definition: regexp.hpp:127

END_NCBI_SCOPE
#define END_NCBI_SCOPE
End previously defined NCBI scope.
Definition: ncbistl.hpp:103

END_SCOPE
#define END_SCOPE(ns)
End the previously defined scope.
Definition: ncbistl.hpp:75

BEGIN_NCBI_SCOPE
#define BEGIN_NCBI_SCOPE
Define ncbi namespace.
Definition: ncbistl.hpp:100

BEGIN_SCOPE
#define BEGIN_SCOPE(ns)
Define a new scope.
Definition: ncbistl.hpp:72

SIZE_TYPE
NCBI_NS_STD::string::size_type SIZE_TYPE
Definition: ncbistr.hpp:132

kEmptyStr
#define kEmptyStr
Definition: ncbistr.hpp:123

NStr::CompareNocase
static int CompareNocase(const CTempString s1, SIZE_TYPE pos, SIZE_TYPE n, const char *s2)
Case-insensitive compare of a substring with another string.
Definition: ncbistr.cpp:219

NStr::Split
static list< string > & Split(const CTempString str, const CTempString delim, list< string > &arr, TSplitFlags flags=0, vector< SIZE_TYPE > *token_pos=NULL)
Split a string using specified delimiters.
Definition: ncbistr.cpp:3461

NStr::FindNoCase
static SIZE_TYPE FindNoCase(const CTempString str, const CTempString pattern, SIZE_TYPE start, SIZE_TYPE end, EOccurrence which=eFirst)
Find the pattern in the specified range of a string using a case insensitive search.
Definition: ncbistr.cpp:2993

NStr::IsBlank
static bool IsBlank(const CTempString str, SIZE_TYPE pos=0)
Check if a string is blank (has no text).
Definition: ncbistr.cpp:106

NPOS
#define NPOS
Definition: ncbistr.hpp:133

NStr::TruncateSpacesInPlace
static void TruncateSpacesInPlace(string &str, ETrunc where=eTrunc_Both)
Truncate spaces in a string (in-place)
Definition: ncbistr.cpp:3201

NStr::Find
static SIZE_TYPE Find(const CTempString str, const CTempString pattern, ECase use_case=eCase, EDirection direction=eForwardSearch, SIZE_TYPE occurrence=0)
Find the pattern in the string.
Definition: ncbistr.cpp:2891

NStr::Join
static string Join(const TContainer &arr, const CTempString &delim)
Join strings using the specified delimiter.
Definition: ncbistr.hpp:2697

NStr::EqualCase
static bool EqualCase(const CTempString s1, SIZE_TYPE pos, SIZE_TYPE n, const char *s2)
Case-sensitive equality of a substring with another string.
Definition: ncbistr.hpp:5325

NStr::StartsWith
static bool StartsWith(const CTempString str, const CTempString start, ECase use_case=eCase)
Check if a string starts with a specified prefix value.
Definition: ncbistr.hpp:5412

NStr::ReplaceInPlace
static string & ReplaceInPlace(string &src, const string &search, const string &replace, SIZE_TYPE start_pos=0, SIZE_TYPE max_replace=0, SIZE_TYPE *num_replace=0)
Replace occurrences of a substring within a string.
Definition: ncbistr.cpp:3405

NStr::ToUpper
static string & ToUpper(string &str)
Convert string to upper case – string& version.
Definition: ncbistr.cpp:424

NStr::ToLower
static string & ToLower(string &str)
Convert string to lower case – string& version.
Definition: ncbistr.cpp:405

NStr::eNocase
@ eNocase
Case insensitive compare.
Definition: ncbistr.hpp:1206

CAuth_list_Base::IsSetAffil
bool IsSetAffil(void) const
author affiliation Check if a value has been assigned to Affil data member.
Definition: Auth_list_.hpp:498

CAffil_Base::C_Std::SetCountry
void SetCountry(const TCountry &value)
Assign a value to Country data member.
Definition: Affil_.hpp:897

CAffil_Base::C_Std::SetSub
void SetSub(const TSub &value)
Assign a value to Sub data member.
Definition: Affil_.hpp:850

CAuth_list_Base::GetAffil
const TAffil & GetAffil(void) const
Get the Affil member data.
Definition: Auth_list_.hpp:510

CCit_sub_Base::GetAuthors
const TAuthors & GetAuthors(void) const
Get the Authors member data.
Definition: Cit_sub_.hpp:357

CCit_sub_Base::IsSetAuthors
bool IsSetAuthors(void) const
not necessarily authors of the paper Check if a value has been assigned to Authors data member.
Definition: Cit_sub_.hpp:345

CCit_sub_Base::SetAuthors
void SetAuthors(TAuthors &value)
Assign a value to Authors data member.
Definition: Cit_sub_.cpp:74

CAffil_Base::C_Std::GetSub
const TSub & GetSub(void) const
Get the Sub member data.
Definition: Affil_.hpp:841

CAffil_Base::C_Std::GetCountry
const TCountry & GetCountry(void) const
Get the Country member data.
Definition: Affil_.hpp:888

CAffil_Base::GetStd
const TStd & GetStd(void) const
Get the variant data.
Definition: Affil_.cpp:214

CAffil_Base::IsStd
bool IsStd(void) const
Check if variant Std is selected.
Definition: Affil_.hpp:1207

CAffil_Base::C_Std::IsSetCountry
bool IsSetCountry(void) const
Author Affiliation, Country Check if a value has been assigned to Country data member.
Definition: Affil_.hpp:876

CAffil_Base::SetStd
TStd & SetStd(void)
Select the variant.
Definition: Affil_.cpp:220

CAffil_Base::C_Std::IsSetSub
bool IsSetSub(void) const
Author Affiliation, County Sub Check if a value has been assigned to Sub data member.
Definition: Affil_.hpp:829

CSeqdesc_Base::GetSource
const TSource & GetSource(void) const
Get the variant data.
Definition: Seqdesc_.cpp:566

CSeqdesc_Base::e_Source
@ e_Source
source of materials, includes Org-ref
Definition: Seqdesc_.hpp:133

CSeq_inst_Base::eMol_na
@ eMol_na
just a nucleic acid
Definition: Seq_inst_.hpp:113

input
static int input()
Definition: lex.newick.cpp:1147

i
int i
Definition: lex.newick.cpp:1456

n
yy_size_t n
Definition: lex.newick.cpp:1455

compile_time_bits::tagStrNocase
std::integral_constant< ncbi::NStr::ECase, ncbi::NStr::eNocase > tagStrNocase
Definition: ct_string_cxx14.hpp:44

objects
Definition: wiggle_export_job.hpp:44

a
unsigned int a
Definition: ncbi_localip.c:102

ncbi_pch.hpp

isalpha
int isalpha(Uchar c)
Definition: ncbictype.hpp:61

isspace
int isspace(Uchar c)
Definition: ncbictype.hpp:69

tolower
int tolower(Uchar c)
Definition: ncbictype.hpp:72

isdigit
int isdigit(Uchar c)
Definition: ncbictype.hpp:64

toupper
int toupper(Uchar c)
Definition: ncbictype.hpp:73

ispunct
int ispunct(Uchar c)
Definition: ncbictype.hpp:68

seqdesc_ci.hpp

SStaticPair
Template structure SStaticPair is simlified replacement of STL pair<> Main reason of introducing this...
Definition: static_set.hpp:60

result
else result
Definition: token2.c:20

regexp.hpp
C++ wrappers for the Perl-compatible regular expression (PCRE) library.

const
#define const
Definition: zconf.h:232