Speksien hienous

Olen kuvia uuteen webbigalleriaan valmistellessa lueskellut pätkiä “IPTC – NAA Information Interchange Model Version 4″ speksistä, jossa kuvaillaan yhtä metadatamuotoa (IPTC) jota voi käyttää esim. JPEG-kuvissa.

Sen on kirjoittanut poppoo nimeltä “Comité International des Télécommunications de Presse”, ja vaikka yhteystiedot viittaa UK/USAan niin tuo nimi ei ja myös tuossa speksissä itsessään on ihmeellisyyksiä joita kuulemma ranskalaisten tekemissä telealan spekseissä on paljonkin.

Esimerkiksi, sen tekijöiden mielestä on loogisinta esittää kahdeksan bitin mittainen pätkä (oktetti) dataa näin: “5/10″ (heksana sama olisi siis 5a).

Kun jossain speksissä törmää tietoon että jonkun kentän sisällöksi pitäisi laittaa “5/10″, niin ei siitä kyllä ihminen heti keksi että se tarkoittaa että oktetin 4 ylintä bittiä on 5 ja 4 alinta on 10 (eli heksadigitti a). Onkohan heksadesimaalinotaation keksinyt joku kansa jolle ranskalaiset ovat ikuisesti katkeria eivätkä siksi suostu vapaaehtoisesti sitä käyttämään?

Toisaalta taas heti speksin sivulla 8 määritellään että:

minute: A period of time of 60 seconds.

On se hyvä että tekijät ovat huomioineet ettei kaikkien yleissivistykseen välttämättä kuulu käsite “minuutti”. Millähän tavalla “minuutin” voi käsittää siten väärin, että on katsottu parhaaksi määritellä, että mitä tässä asiayhteydessä “minuutilla” tarkoitetaan? Myös esimerkiksi vuosi on määritelty.

Juttu jota varten aloin tuota speksiä tutkia oli selvittää että millä merkistöllä IPTC:n tekstikenttiin pitäisi teksti pistää, kun kaikki ohjelmat eivät tunnu olevan siitä yhtä mieltä (webbigalleria oli tyytyväinen ISO8859-1:stä, Photoshop pisti sinne Mac Romania, ja UTF-8 ei oikein kelvannut).

Selvisi, että käytetyn merkistön voi kertoa. Mikään kokeilemistani ohjelmista vain ei sitä tehnyt. Onneksi löysin webistä ulkopuolisen selityksen siitä että miten se tehdään, nimittäin tuo merkistön kertominen on myöskin aika selkeää. UTF-8 koodaus ilmaistaan näin: ensin escape, sitten valitaan “Control Function Repertoire” (jonka “intermediate character” on 2/1), ja sen alta UTF-8 = 4/7. Siitä tulee tekstinä ASCII-merkistössä “ESC % G”. Tähänkin voisi vielä monimutkaisemman tavan keksiä jos erikseen alkaisi näkemään vaivaa.

Tuo sentään selvisi, toinen kuvien metadataan liittyvä mysteeri on vielä ratkaisematta: JEITAn (Japan Electronics and Information Technology Industries Association) speksaamaan EXIF metadataan voi nimittäin pistää GPS koordinaatit. Siellä voi myöskin kertoa, että mikä niiden koordinaattien tarkkuus on.

Ongelma vain on siinä, että kukaan ei ilmeisesti ole missään ikinä määritellyt että miten se “data degree of precision” kenttä tulkitaan. Siihen tarkkuuskenttään kirjoitetaan kaksi 32-bittistä lukua, joista ensimmäinen on osoittaja ja jälkimmäinen nimittäjä, ja se on siinä.

Mutta jos pistän siihen vaikka että “314159/100000″, niin mitä perhanaa se tarkoittaa? Piin approksimaation verran koordinaattikenttien bittejä on tarkkoja? Tai ei ole tarkkoja? Koordinaatit on noin monen metrin (matka, jonka valo kulkee tyhjiössä 1/299 792 458 sekunnissa) tarkkuudella oikein? Paras arvaus lienee että se ei tarkoita “datan tarkkuusaste” vaan asteita konkreettisesti. Ken tietää.

posted on 15 November 2006 at 21:27

<∴>
You can trackback this post from your own site.

Leave a Reply