Cos'è meta charset?

Un charset o set di caratteri completo è essenzialmente un insieme di caratteri riconosciuti dal computer allo stesso modo in cui la calcolatrice può identificare i numeri. Ognuno di questi caratteri è rappresentato da un numero noto come punto di codice e ciò crea un canale di comunicazione per la codifica e la decodifica dei contenuti.

Un set di caratteri, quindi, contiene caratteri che servono uno scopo specifico o particolare. Il computer memorizza i caratteri come uno o più byte. Un esempio è il set di caratteri ASCII che rappresenta tutti i caratteri inglesi e i caratteri di controllo speciali con numeri da 0-127.

Tuttavia, la maggior parte dei set di caratteri funziona solo per lingue specifiche e riconosce caratteri limitati e ciò rende la codifica e la decodifica difficili o impossibili. Nell'era moderna, tuttavia, l'Unicode è il set di caratteri più affidabile e universalmente accettato a causa della sua capacità di tradurre facilmente codici e numeri.

Puoi vedere il meta charset nell'intestazione del tuo codice html

<meta charset="utf-8">

Come funziona?

Meta Charset è ciò che determina come il testo viene trasmesso e memorizzato. Questi dati di testo vengono di solito convertiti prima in binario e poi c'è bisogno di una sorta di cifrario che collega i caratteri con i loro equivalenti binari corretti.

Quando questi dati vengono infine decodificati, la codifica dei caratteri deve essere nota in anticipo o potrebbero verificarsi complicazioni. Un esempio di ciò può essere visto nei browser quando si sta guardando una pagina web. Le informazioni riguardo il tipo di set di caratteri utilizzato provengono dal server o sono scritte direttamente dallo sviluppatore. Sfortunatamente, esiste una miriade di set di caratteri e ciò significa modi diversi di associare codici binari a caratteri e byte.

Per sviluppatori di contenuti e autori, scegliere il set di caratteri UTF-8 per i vostri contenuti significa che potete utilizzare un unico set di caratteri per molteplici esigenze di caratteri, semplificando notevolmente le cose senza la necessità di tracciare e convertire più volte. Questo significa che sarà più facile navigare attraverso i vostri contenuti senza imbattersi in caratteri confusi e spazzatura

AddType 'text/html; charset=UTF-8' html

Perché è importante?

Quando si pensa al fatto che ogni volta che un testo viene trasmesso, deve essere codificato in un set di caratteri specifico e decodificato dall'altro lato, l'importanza del set di caratteri è piuttosto evidente. Questo significa che senza una corretta codifica dei caratteri, un browser visualizzerà del testo incomprensibile perché semplicemente non capisce ciò che gli viene inserito e deve fare una rapida supposizione non informata.

È importante anche nei moduli html perché quando inserisci testo nelle caselle di testo sui siti o sulle piattaforme di social media, deve essere codificato con attenzione. Se queste informazioni non sono disponibili per qualsiasi motivo, il mappaggio errato potrebbe portare alla perdita di informazioni vitali.

Esempio di codice Charset

Quello che fa un set di caratteri è fornire una chiave per sbloccare e decifrare un codice che passa tra l'utente e il sito web.

È un insieme di mappature strutturate tra i byte nel computer e i caratteri nel set di caratteri. Se questa chiave manca, i dati sembrano scritti a caso. Questo significa che quando inserisci testo attraverso una tastiera, il set di caratteri collega i caratteri che scegli a specifici byte nella memoria del computer, e poi per visualizzare il testo legge i byte e li riconverte nei caratteri.

È un fattore di ranking per la SEO?

Il set di caratteri non è un fattore di ranking per l'ottimizzazione dei motori di ricerca. La maggior parte dei motori di ricerca si concentra sull'obiettivo importante di fornire contenuti pertinenti e utili a coloro che li cercano e, come tale, non considera altri fattori esterni che non contribuiscono a tale obiettivo.

Quindi il tuo set di caratteri è importante a causa del modo in cui trasmetti le informazioni, ma i motori di ricerca non sono interessati ad esso. Utilizzare altri set di caratteri diversi da Utf-8 non diminuirà il tuo posizionamento SEO perché, in larga misura, non importa quale codifica dei caratteri utilizzi finché il motore di ricerca è in grado di fornire informazioni agli utenti finali.

Come posso aggiungerlo se ne ho bisogno?

Puoi aggiungere un set di caratteri al tuo sito web utilizzando il seguente codice

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

Perché questo funzioni, dovresti includerlo nel PHP che include il tuo file html. È importante notare che potrebbe non funzionare su tutte le pagine web poiché il codice sopra non è una funzione ma una dichiarazione, quindi dovresti includere il tuo html della pagina. Questo tenendo presente che la pagina web php utilizza il set di caratteri Utf-8 nel suo header.

Diversi tipi di set di caratteri

La maggior parte dei set di caratteri è nata dalle esigenze dei clienti di singoli produttori. La maggior parte dei set di caratteri non è compatibile l'uno con l'altro (con alcune eccezioni). I tre set di caratteri più comuni sono, ASCII (1968), ISO 8859-1 (1987) e UTF-8 (1996).

ASCII

Charset per la lingua inglese. Contiene 7 bit che sono mappati in 128 caratteri. Ogni lettera è assegnata a un numero da 0 a 127. Questo set di codici è piuttosto limitato, ma essendo uno dei pionieri ha scatenato la creazione di un set di caratteri per ciascuna delle altre lingue. La maggior parte dei computer utilizza i codici ASCII per rappresentare il testo.

tabella dei caratteri ascii

Unicode

Unicode è stato creato per unificare 135 lingue moderne e storiche sotto un unico standard. Unicode è uno standard e non un set di caratteri di per sé. A maggio 2019, versione 12.1, Unicode contiene 137,994 caratteri inclusi simboli ed emoji. Lo standard Unicode definisce UTF-8, UTF-16 e UTF-32

UTF-8

Ora il codice dominante di internet. UTF-8 è utilizzato nel 94% dei siti web. Codifica i caratteri più comuni, i numeri di base e l'inglese con 8-bit. UTF-8 utilizza un minimo di 1 byte. UTF-8 è inoltre identico ad ASCII per l'inglese. Questo significa che qualsiasi testo ASCII è anche un testo UTF-8.

Esempio di codice charset UTF-8

Fonte dell'immagine

UTF-16

Unicode con 16 bit. Sebbene fosse originariamente utilizzato con sistemi come Windows e Java, non ha mai realmente preso piede con Linux e macOS. Oggi UTF-16 è utilizzato con lo 0,01% delle pagine web. UTF-16 utilizza un minimo di 2 byte.

Esempio di set di caratteri Unicode UTF-16

Fonte dell'immagine

UTF-32

Unicode con 32 bit. Il vantaggio di UTF-32 è che i punti Unicode sono direttamente indicizzati. Lo svantaggio è che non è efficiente nell'uso dello spazio poiché utilizza sempre 4 byte. Questo significa fino al doppio delle dimensioni di UTF-16 e quattro volte rispetto a UTF-8.

In conclusione

Allora, quali sono i benefici SEO del charset? Anche se non è un fattore diretto di posizionamento, dovrai essere consapevole del tuo charset. Se mostri accidentalmente 2 standard diversi nel tuo meta charset o non segui correttamente le regole dello standard, allora avrai un problema di decodifica e il tuo contenuto non verrà visualizzato correttamente. Questo impatterà negativamente sul tuo SEO.

Se implementi correttamente il tuo charset allora aiuterai a prevenire un alto tasso di rimbalzo, non darai alle persone una ragione per non linkarti e i motori di ricerca non potranno interpretare erroneamente il tuo contenuto, il che aiuterà i tuoi sforzi SEO.