Šorm et al. sono stati i primi a pubblicare uno specifico sistema di abbreviazione a lettera singola, in On proteins. LXIII. Le strutture inferiori nelle catene di proteine si raccolgono. Ceca. Chimica. Comune. 1961, 26, 531-578.
In questa pubblicazione è stato pubblicato anche un precedente, inedito, sistema di Hans Neurath.
Se si vogliono proporre simboli pratici, essi devono essere conformi ai seguenti requisiti: (l) 23 diversi simboli della lettera di aminoacidi che si verificano in strutture proteiche devono essere scelti, (2) solo semplici simboli accessibile attualmente in stampa-funziona con la possibilità di essere scritti dai comuni macchine da scrivere deve essere utilizzato, (3) i simboli devono offrire la possibilità di esprimere se i bond della sequenza è determinato o, in alternativa, finora indeterminato, entro lo spazio di una sola lettera, e (4) l’utilizzo di simboli devono essere internazionali applicabilità.
L’uso di cifre è escluso dal requisito (1) e l’uso di lettere e simboli greci o di altre lettere non comuni dal requisito (2). Il modo più appropriato sembra essere l’uso delle lettere comuni dell’alfabeto latino, che è conforme al requisito (4) e consente di distinguere secondo (3) tra sequenze determinate e indeterminate scegliendo lettere maiuscole o minuscole. Per esprimere una sequenza determinata della catena peptidica proponiamo di utilizzare lettere maiuscole secondo la Tabella VIII e, inoltre, di mettere lettere minuscole in punti in cui sono state finora utilizzate parentesi e virgole. I nostri simboli derivano dai nomi inglesi degli amminoacidi. Poiché, tuttavia, le lettere identiche ricorrono comunemente all’inizio dei nomi, non potrebbero essere utilizzate in modo coerente nei nostri simboli. Né potrebbe essere compilato un sistema completo che includa simboli a due lettere delle prime due lettere del nome (ad esempio acido glutammico, glutammina, glicina); inoltre ciò sarebbe in contraddizione con il sistema previsto di simboli a una lettera. Pertanto, abbiamo compromesso e le prime lettere sono proposti come simboli solo in alcuni casi (asparatic acido, acido glutammico, cisteina (a metà), istidina, metionina, prolina, serina, triptofano, valina), in molti altri casi, simboli caratteristici derivati dall’ortografia (ala – l, arg – r, lys – i, leu – u, ileu – w, phe – f) o dalla rappresentazione grafica (glu – g, glu(NH$_2$)- q) sono stati scelti.
Šorm è stato il primo ad usare “Q” per la glutammina. (Neurath aveva usato ” E ‘ sia per la glutammina e acido glutammico.)
Neurath ha usato” O “per la lisina e Šorm ha usato”I”.
Nessun sistema unificato è stato utilizzato fino alla selezione da parte di IUPAC.