Un octet est une unité de mesure en informatique mesurant la quantité de données. Un octet est lui-même composé de 8 bits, soit 8 chiffres binaires.
Un octet peut servir à noter un nombre naturel, en informatique on dit aussi « non signé », entre 0 et 255. Une autre convention courante, le complément à deux, permet de noter un nombre entier, ou « signé », entre -128 et +127 compris. Voir aussi l'article Système binaire.
De nombreuses conventions existent pour représenter un caractère par un ou plusieurs octets. On peut notamment citer le codage ISO 8859-1 très utilisé pour représenter avec un octet les 26 lettres minuscules, les 26 majuscules, les 10 chiffres, les lettres accentuées et la ponctuation, des langues d'Europe occidentale, dont le français. Plus récent, le codage UTF-8 permet de noter tout caractère avec un à quatre octets, selon le caractère. Voir aussi l'article Format de données.
Lorsque le traitement se fait sur plusieurs octets simultanément, notamment 2 octets (16 bits) et 4 octets (32 bits), on parle parfois de mot et de double-mot. La signification de ces termes a tendance à varier avec le contexte, aussi n'est-il pas recommandé de les utiliser.
La lettre o n'est pas acceptable dans le Système international d'unités (SI) à cause du risque de confusion avec le chiffre 0. La lettre B, quant à elle, est le symbole du bel dans le système SI. Cette question n’est pas résolue, les unités d’information ne faisant pas partie du SI.
Par convention, de manière erronée selon le SI, et avant la normalisation de 1998, on utilise les unités dérivées que sont le kilo-octet (ou kilooctet), le mégaoctet, le gigaoctet pour représenter les valeurs suivantes en puissance de 2 :
La langue française pose un problème de syntaxe, relative à la voyelle initiale. Aussi, voit-on les formes « kilo-octet », « kilooctet » ou « kiloctet » dans la littérature.
Les préfixes kilo, méga, giga, téra, etc., correspondent aux mêmes multiplicateurs que dans tous les autres domaines : des puissances de 10.
Appliqué à l'informatique, cela donne :
Il est à noter que l'usage traditionnel reste largement en vigueur chez les informaticiens et les électroniciens ; l'usage des préfixes suivants est très restreint et se répand très lentement.
Cette distinction est d'ailleurs utilisée depuis longtemps par les fabricants de disques durs. Le fait que l'usage de préfixes en puissances de 10 permette d'afficher commercialement des capacités supérieures à celles données par les puissances de 2 n'est certes pas nuisible du point de vue de la mise en marché, mais peut introduire une erreur d'appréciation de la part des utilisateurs non avertis. Ainsi, un disque dur de 100 gigaoctets (100×109 octets) contient le même nombre (arrondi) d'octets qu'un disque de 93,13 gibioctets (93,13×230 octets). Les disques durs courants étant divisés en secteurs de 512 octets, un comptage en unités de 1024 octets serait plus naturel — du moment que les préfixes binaires soient utilisés.
بايت | Byte | Байт | Byte | Byte | Byte | Byte | Byte | Bitoko | Byte | Bait | Byte | بایت | Tavu (tietotekniikka) | Byte | בית (מחשב) | Bajt | Bájt | Byte | Byte | Byte | バイト (情報) | 바이트 | Baitas | Bait | Byte | Byte | Bajt (informatyka) | Byte | Octet | Байт | Byte | Bajt | Bajt | Бајт | Byte (enhet) | ไบต์ | Bayt | Байт | Byte | 字节