article

Smiles (ang. Simplified Molecular Input Line Entry Specification - uproszczony zapis struktury cząsteczek w postaci liniowej informacji tekstowej. Język ten jest stosowany do prostego i precyzyjnego opisu budowy i (po części) kształtu cząsteczek związków chemicznych i prostych przemian.

Specyfikacja Smiles została stworzona przez firmę Daylight i stanowi jej własność. Firma ta pobiera opłatę licencyjną od twórców programów, którzy chcą ją wbudowywać w swoje produkty, co ogranicza poważnie liczbę programów, które obsługują Smiles. Aktualnie trwają starania, aby specfykacja Smiles została oficjalnie dodana do zbioru MIME.

Smiles umożliwia zapisywanie struktury cząsteczek, w których występują wiązania kowalencyjne i jonowe. Nie ma natomiast w nim możliwości zapisywania cząsteczek, w których występują wiązania wodorowe i koordynacyjne.

Zapis Smiles jest funkcjonalnie zbliżony do zwykłych wzorów strukturalnych - nie można w nim więc zapisywać konformacji cząsteczek, czy ich rzeczywistej struktury przestrzennej uwzględniającej długości i kąty wiązań.

Smiles jest stosowany do wymiany informacji o strukturach chemicznych między różnymi programami takimi jak bazy danych, programy do wizualizacji cząsteczek, programy do rysowania wzorów strukturalnych itp.

Krótki opis języka


Pomimo, że SMILES jest językiem przeznaczonym głównie do związków organicznych, to można nim opisać większość związków nieorganicznych, np: *O*(=O)(=O)=O.

Atomy


Atom w języku SMILES reprezentowany jest przez symbol odpowiedniego pierwiastka, który to można znaleźć w układzie okresowym. Symbol ten zamyka się w nawiasy kwadratowe.

Na ] *

[http://www.daylight.com/daycgi/smi2gif-small?5b42725d202373.gif

[http://www.daylight.com/daycgi/smi2gif-small?5b2a5d202373.gif

Symbol * jest symbolem uniwersalnym i opisuje dowolny pierwiastek.

Dodatkowo w nawiasie można umieścić inne informacje takie jak masa izotopu, dodatkowe atomy wodoru przy tym atomie i ładunek. Czynimy to wg wzoru:

>

W ten sposób możeny uzyskać nuklidy:

[http://www.daylight.com/daycgi/smi2gif-small?5b3133435d202373.gif

[http://www.daylight.com/daycgi/smi2gif-small?5b31354e48342b5d202373.gif

*

http://www.daylight.com/daycgi/smi2gif-small?5b43612b325d202373.gif

*

http://www.daylight.com/daycgi/smi2gif-small?5b323030342a4831302b2b5d202373.gif

W szczególnych przypadkach tzw. pierwiastków organicznych (C, O, N, S, P, F, Cl, Br, I, B) przy opisie związków organicznych można pomijać nawiasy kwadratowe. W takim wypadku wolna wartościowość (najniższa) danego pierwiastka zostanie uzupełniona wodorem. Wartościowości to:

B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1)

C

http://www.daylight.com/daycgi/smi2gif-small?43202373.gif

Cl

http://www.daylight.com/daycgi/smi2gif-small?436c202373.gif

O

http://www.daylight.com/daycgi/smi2gif-small?4f202373.gif

Wiązania


Wiązania oznaczamy następującymi symbolami:

- Wiązanie pojedyncze

= Wiązanie podwójne

# Wiązanie potrójne

: Wiązanie aromatyczne

. Brak wiązania (disconnection)

Symbole "-" i ":" są zazwyczaj zupełnie zbędne i można się bez nich obejść. Poniżej zamieszczam przykłady:

C-C-C-C lub CCCC

http://www.daylight.com/daycgi/smi2gif-small?43434343202373.gif

C-C=O lub CC=O

http://www.daylight.com/daycgi/smi2gif-small?43433d4f202373.gif

*-*" target="_blank" >lub [K-O

http://www.daylight.com/daycgi/smi2gif-small?5b4b5d2d4f202373.gif

*-*=*#* lub N=N#N

http://www.daylight.com/daycgi/smi2gif-small?4e3d4e234e202373.gif

*" target="_blank" >nie *

http://www.daylight.com/daycgi/smi2gif-small?5b4e612b5d2e5b436c2d5d202373.gif http://www.daylight.com/daycgi/smi2gif-small?5b4e612b5d5b436c2d5d202373.gif

W drugim przypadku pojawia się komunikat parsera:

 WARNING: Atom has unusual valence 1 (normal 0) (dy_rmbord)
 WARNING: Atom has unusual valence 1 (normal 0) (dy_rmbord)
**
     ^^^^^

Nawiasy


Nawiasy pozwalają uzyskiwać rozgałęzienia - głównie w łańcuchach węglowych, ale w wielu innych miejscach także.

CCCC

http://www.daylight.com/daycgi/smi2gif-small?43434343202373.gif

CC(C)C

http://www.daylight.com/daycgi/smi2gif-small?434328432943202373.gif

CC(=O)O

http://www.daylight.com/daycgi/smi2gif-small?4343283d4f294f202373.gif

**(=*)(=*)=*" target="_blank" >lub *(=O)(=O)=O

http://www.daylight.com/daycgi/smi2gif-small?5b4b5d4f5b4d6e5d283d4f29283d4f293d4f202373.gif

CCCC(C(O)O)CCC

http://www.daylight.com/daycgi/smi2gif-small?434343432843284f294f29434343202373.gif

Pierścienie


Struktury cykliczne tworzymy w taki sposób: Pierścień rozcinamy w dowolnym miejscu i na rozerwanych atomach wstawiamy indeksy, po czym przepisujemy wzór jak zwykły łańcuch pamiętając o indeksach, które umieszczamy za atomami.

SMILES_cykloheksan.gif

To samo z bardziej skomplikowanymi wzorami:

SMILES_benzen.gif

W przypadku wykonywania większych ilości cięć używamy kolejnych par:

c1cc2ccccc2cc1

http://www.daylight.com/daycgi/smi2gif-small?6331636332636363636332636331202373.gif

Ewentualnie po zamknięciu pary można ją jeszcze raz wykorzystać:

c1ccccc1c1ccccc1

http://www.daylight.com/daycgi/smi2gif-small?63316363636363316331636363636331202373.gif

Linki zewnętrzne


Szczegółowa instrukcja składni Smiles: http://www.daylight.com/dayhtml/smiles/smiles-intro.html

Formaty | Chemia

SMILES | SMILES | Simplified molecular input line entry specification | SMILE | SMILES | SMILES | SMILES記法 | SMILES | SMILES | SMILES

 

This article is licensed under the GNU Free Documentation License. It uses material from the "SMILES".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld