Smiles (ang. Simplified Molecular Input Line Entry Specification - uproszczony zapis struktury cząsteczek w postaci liniowej informacji tekstowej. Język ten jest stosowany do prostego i precyzyjnego opisu budowy i (po części) kształtu cząsteczek związków chemicznych i prostych przemian.
Specyfikacja Smiles została stworzona przez firmę Daylight i stanowi jej własność. Firma ta pobiera opłatę licencyjną od twórców programów, którzy chcą ją wbudowywać w swoje produkty, co ogranicza poważnie liczbę programów, które obsługują Smiles. Aktualnie trwają starania, aby specfykacja Smiles została oficjalnie dodana do zbioru MIME.
Smiles umożliwia zapisywanie struktury cząsteczek, w których występują wiązania kowalencyjne i jonowe. Nie ma natomiast w nim możliwości zapisywania cząsteczek, w których występują wiązania wodorowe i koordynacyjne.
Zapis Smiles jest funkcjonalnie zbliżony do zwykłych wzorów strukturalnych - nie można w nim więc zapisywać konformacji cząsteczek, czy ich rzeczywistej struktury przestrzennej uwzględniającej długości i kąty wiązań.
Smiles jest stosowany do wymiany informacji o strukturach chemicznych między różnymi programami takimi jak bazy danych, programy do wizualizacji cząsteczek, programy do rysowania wzorów strukturalnych itp.
Pomimo, że SMILES jest językiem przeznaczonym głównie do związków organicznych, to można nim opisać większość związków nieorganicznych, np: *O*(=O)(=O)=O.
[http://www.daylight.com/daycgi/smi2gif-small?5b42725d202373.gif
[http://www.daylight.com/daycgi/smi2gif-small?5b2a5d202373.gif
Symbol * jest symbolem uniwersalnym i opisuje dowolny pierwiastek.
Dodatkowo w nawiasie można umieścić inne informacje takie jak masa izotopu, dodatkowe atomy wodoru przy tym atomie i ładunek. Czynimy to wg wzoru:
W ten sposób możeny uzyskać nuklidy:
[http://www.daylight.com/daycgi/smi2gif-small?5b3133435d202373.gif
[http://www.daylight.com/daycgi/smi2gif-small?5b31354e48342b5d202373.gif
W szczególnych przypadkach tzw. pierwiastków organicznych (C, O, N, S, P, F, Cl, Br, I, B) przy opisie związków organicznych można pomijać nawiasy kwadratowe. W takim wypadku wolna wartościowość (najniższa) danego pierwiastka zostanie uzupełniona wodorem. Wartościowości to:
B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1)
C
Cl
O
Wiązania oznaczamy następującymi symbolami:
- Wiązanie pojedyncze
= Wiązanie podwójne
# Wiązanie potrójne
: Wiązanie aromatyczne
. Brak wiązania (disconnection)
Symbole "-" i ":" są zazwyczaj zupełnie zbędne i można się bez nich obejść. Poniżej zamieszczam przykłady:
C-C-C-C lub CCCC
C-C=O lub CC=O
*-*" target="_blank" >lub [K-O
W drugim przypadku pojawia się komunikat parsera:
WARNING: Atom has unusual valence 1 (normal 0) (dy_rmbord) WARNING: Atom has unusual valence 1 (normal 0) (dy_rmbord) ** ^^^^^
Nawiasy pozwalają uzyskiwać rozgałęzienia - głównie w łańcuchach węglowych, ale w wielu innych miejscach także.
CCCC
CC(C)C
CC(=O)O
**(=*)(=*)=*" target="_blank" >lub *(=O)(=O)=O
CCCC(C(O)O)CCC
Struktury cykliczne tworzymy w taki sposób: Pierścień rozcinamy w dowolnym miejscu i na rozerwanych atomach wstawiamy indeksy, po czym przepisujemy wzór jak zwykły łańcuch pamiętając o indeksach, które umieszczamy za atomami.
To samo z bardziej skomplikowanymi wzorami:
W przypadku wykonywania większych ilości cięć używamy kolejnych par:
c1cc2ccccc2cc1
Ewentualnie po zamknięciu pary można ją jeszcze raz wykorzystać:
c1ccccc1c1ccccc1
Szczegółowa instrukcja składni Smiles: http://www.daylight.com/dayhtml/smiles/smiles-intro.html
SMILES | SMILES | Simplified molecular input line entry specification | SMILE | SMILES | SMILES | SMILES記法 | SMILES | SMILES | SMILES