Grafemi e glifi

Dice Wikipedia nell’articolo dedicato all’alfabeto latino che “il repertorio latino di base consiste oggi di 26 grafi (comunemente chiamati caratteri o lettere) di seguito rappresentati in maiuscolo e minuscolo”.

Insomma, ogni lettera dell’alfabeto sarebbe un grafo.

La A maiuscola non sarebbe un grafo diverso rispetto alla a minuscola.

“Un sistema di scrittura è composto da un insieme di grafemi e da regole che permettono di combinarli per poter mettere in atto il processo di scrittura”, spiega Wikipedia nella pagina dedicata. “I grafemi sono le più piccole unità funzionali del sistema di scrittura alle quali si può associare una unità linguistica (che, a seconda della tipologia del sistema di scrittura, può essere un fonema, una sillaba o un morfema)”.

Cercando la parola “grafi” otteniamo la definizione di strutture matematiche che c’entrano ben poco con quello che ci interessa. Solo attraverso la disambiguazione arriviamo alla pagina dedicata ai “grafemi”, sinonimo evidentemente ma specifico per quanto riguarda i sistemi di scrittura.

Un grafema è un “segno elementare e non ulteriormente suddivisibile che costituisce l’unità minima dei sistemi di scrittura”.

Si indicano tra parentesi angolate.

Non sempre ad ogni grafema corrisponde un fonema. Ad esempio per indicare il suono iniziale della parola “gnomo” si usano due grafemi combinati insieme, “gn”.

L’articolo contiene anche la definizione della parola “allografo”, che è una “variante combinatoria o contestuale, ossia una variante del grafema determinata dal contesto in cui il grafema dovrebbe comparire”. In base a questa definizione, la maiuscola è l’allografo del grafema minuscolo, ossia la variante che compare in corrispondenza dell’inizio dei nomi propri o in inizio di frase (periodo).

Un termine usato in tipografia è quello di glifo, ma qui non andiamo a toccare tanto le differenze linguistiche ma quelle grafiche.

Wikipedia mostra un’immagine con varie a minuscole in vari font diversi, che hanno forme diverse. “Tipologie di glifi che rappresentano la lettera minuscola a” dice la didascalia.

“In tipografia, il glifo è una rappresentazione concreta di un grafema, più grafemi, o di parte di un grafema, senza porre attenzione alle caratteristiche stilistiche”.

“Mentre un grafema è un’unità di testo, un glifo è un’unità grafica”, dice l’articolo, che fa l’esempio della legatura fi, che è composta da due lettere, quindi due grafemi, ma costituisce un unico glifo.

Per il sito Grafigata, “nella tipografia un glifo è un segno che rappresenta in modo specifico la forma, l’estetica e il design di un carattere”.

“All’interno di un carattere tipografico, un glifo è una precisa rappresetazione grafica che può essere un grafema, parte di esso o un’unione di più grafemi”.

Ad ogni lettera possono corrispondere vari glifi: la versione maiuscola, minuscola, maiuscoletta, ma anche corsiva, accentata, e le possibili varianti stilistiche.

Il sito dice che la parola glifo non solo si può riferire alle varianti della lettera a, ma anche alle “diverse forme del numero 3 in diversi font”.

I testi in italiano descrivono un quadro abbastanza semplice, ma se diamo un’occhiata a quelli inglesi troviamo qualche complicazione.

Ad esempio Wikipedia dice che “il grafema à richiede due glifi, la a di base e l’accento. In generale un diacritico è considerato un glifo anche se è contiguo al resto del carattere, come la cediglia in francese”.

Ancora la versione inglese di Wikipedia ci dà la definizione di omoglifo, mancante nella versione italiana: “In ortografia e tipografia, un omoglifo è uno di due o più grafemi, caratteri o glifi con forme che appaiono identiche o molto simili ma possono avere differenti significati”.

L’articolo contiene anche un grafico con tutte le lettere degli alfabeti latino, greco e cirillico inserite in tre cerchi che si intersecano tra di loro. Alcune lettere sono comuni a tutti e tre gli alfabeti (OMKTAXYHBPE), ma in Unicode hanno code points separati.

Anche se la forma delle lettere è la stessa, nel software che si usa per realizzare il font sono previste diverse caselle a seconda dell’alfabeto in cui vanno inserite. Una volta che il type designer ha realizzato la forma della A dell’alfabeto latino, può incollare il riferimento nella casella dedicata alla alfa maiuscola dell’alfabeto greco o alla A maiuscola dell’alfabeto cirillico.

Quindi, dal punto di vista del type designer, si tratterebbe di glifi diversi anche se hanno la stessa forma (nel software c’è il pulsante “vai al glifo successivo” per spostarsi dall’uno all’altro.

Gli accenti invece fanno parte integrante di quello che il disegnatore di caratteri chiama glifo. Anche se si disegna separatamente la a in una casella e l’accento in un’altra casella, questi due segni devono essere composti in un unico carattere, quello dalla a accentata, che il disegnatore può chiamare glifo.

Dal punto di vista informatico ci possono essere dei problemi di sicurezza derivati dalla presenza di omoglifi.

Scrivere “ciao” o scrivere “ciaо” non è la stessa cosa: nel secondo caso ho usato la о dell’alfabeto cirillico, che visivamente è indistinguibile dalla o dell’alfabeto latino ma in realtà corrisponde a un codice diverso.

Sarebbe possibile per i malintenzionati registrare un dominio visivamente uguale a quello originale ma composto di lettere diverse.

Ovviamente sono state prese delle precauzioni per evitare tutto ciò. Ad esempio chi fornisce il servizio spesso non accetta nomi composti da un mix di lettere provenienti da alfabeti diversi.

Altri paragrafi vengono dedicati alla distinzione tra le lettere nello stesso alfabeto che possono creare qualche confusione, ad esempio quando nei caratteri senza grazie la l minuscola è uguale alla I maiuscola, e agli omoglifi multi-lettera, che si vengono a creare quando due lettere vicine diventano uguali o quasi uguali a un’altra lettera, come la combinazione rn che può somigliare a una m.

Commenti

Post più popolari