Identificador de Recursos Internacionalitzat

L'article o secció necessita millores de format.
Pot necessitar retocs en negretes, cursives, enllaços, imatges, categories, infotaules...

L'Identificador de Recursos Internacionalitzat (IRI) va ser definit el 2005 per l'Internet Engineering Task Force (IETF) com un nou estàndard d'Internet per estendre l'esquema existent de l'Identificador Uniforme de Recursos (URI).[1] El nou estàndard es va publicar a RFC 3987.

Mentre que els URIs es limiten a un subconjunt dels caràcters ASCII, els IRI poden contenir caràcters del conjunt de caràcters universals (Unicode / ISO 10646), incloent caràcters kanji xinesos o japonesos, coreans, ciríl·lics, i altres.

Sintaxi

Els IRIs suposen una ampliació dels URIs utilitzant Unicode, donat que els URIs estaven limitats a l'ASCII, amb molts menys caràcters. Els IRIs podrien representar-se amb una seqüència d'octets, però per definició es defineixen com una seqüència de caràcters, de manera que puguin pronunciar-se o escriure's.[2]

Compatibilitat

Per tal de conservar la compatibilitat amb sistemes que no admeten el nou format, s'efectua una conversió de IRIs a URIs.[2]

Per a aplicacions i protocols que no permeten la utilització directa d'IRIs, els IRIs s'han de convertir primer a Unicode utilitzant la norma de composició canònica (NFC).

A continuació s'han de convertir tots els punts de codi no-ASCII de l'IRI a UTF-8, i els bytes resultants han de ser codificats percentualment, per tal de produir un URI vàlid.

Exemple: l'IRI [enllaç sense format] https://en.wiktionary.org/wiki/Ῥόδος es converteix en l'URI [enllaç sense format] https://en.wiktionary.org/wiki/%E1%BF%AC%CF%8C%CE%B4%CE%BF%CF%82

Segons quina sigui la implementació, els punts de codi ASCII que són caràcters URI no vàlids poden codificar-se de la mateixa manera.[3]

Aquesta conversió és fàcilment reversible; per definició, la conversió d'un IRI a un URI i al revés de URI a IRI produirà un IRI que és semànticament equivalent a l'IRI original, tot i que pot diferir en la seva representació exacta.

Alguns protocols poden imposar transformacions addicionals. Per exemple. Punycode per a etiquetes DNS.

Referències

  1. Gangemi, Aldo; Presutti, Valentina «The bourne identity of a web resource». Proceedings of Identity Reference and the Web Workshop (IRW). National Research Council (ISTC-CNR) [Roma, Italy], 2006, pàg. 3. «Notice that IRIs (Internationalized Resource Identifier) [11] are supposed to replace URIs in next future.»
  2. 2,0 2,1 Duerst, M. «RFC 3987». Network Working Group. Internet Engineering Task Force, Standards Track, 2005 [Consulta: 12 octubre 2014].
  3. Hendler, Hrsg. Dieter Fensel; Hrsg. John Domingue; Hrsg. James A.. Handbook of Semantic Web Technologies. 1. Aufl.. Berlín: Springer-Verlag GmbH, 2010. ISBN 978-3-540-92912-3 [Consulta: 12 octubre 2014]. 

Vegeu també

Enllaços externs

  • Activitat d'internacionalització del W3C (anglès)
  • RFC 3987: Proposta d'estàndard d'Identificador de Recursos Internacionalitzat (IRI) (anglès)
  • Llista d'esquemes d'URIs registrats (anglès)