メタ文字セットとは何ですか?

charsetまたはcharacter setは、計算機が数字を識別できるのと同じように、コンピューターによって認識される一連の文字のことです。これらの各文字はcode pointとして知られる数字によって表され、これによってコンテンツのエンコーディングとデコーディングのための通信チャネルが作られます。

したがって、文字セットには特定の目的または特別な目的で使用される文字が含まれています。コンピュータは文字を1バイト以上で保存します。例としては、ASCII文字セットがあり、これはすべての英語の文字と特別な制御文字を0-127の数字で表します。

しかし、ほとんどの文字セットは特定の言語にのみ機能し、限られた文字を認識するため、コーディングやエンコーディングを困難または不可能にします。しかし、現代では、Unicodeがコードや数字を簡単に変換できる能力のため、最も信頼性が高く普遍的に受け入れられている文字セットです。

あなたのhtmlコードのヘッダーでメタ文字セットを確認することができます

<meta charset="utf-8">

それはどのように機能するのか?

Meta Charsetは、テキストがどのように伝送され、保存されるかを決定するものです。このテキストデータは通常、最初にバイナリに変換され、その後、文字とそれに対応する正しいバイナリ同等物を結びつける種類の暗号が必要になります。

このデータが最終的にデコードされるとき、文字エンコーディングは事前に知られていなければならず、そうでないと問題が発生する可能性があります。これの例は、ウェブページを見ているときにブラウザで見ることができます。使用されている文字セットの種類に関する情報はサーバーから来るか、直接開発者によって書かれます。残念ながら、文字セットは無数にあり、これはバイナリコードを文字やバイトにマッチングする多様な方法を意味します。

コンテンツ開発者や著者にとって、コンテンツの文字セットにUTF-8を選択することは、複数の文字のニーズに対応するために単一の文字セットを使用できることを意味し、複数回にわたる追跡や変換の必要性なしに大幅に簡素化することができます。これは、混乱する文字やゴミが出ることなくコンテンツをスムーズに閲覧することが容易になることを意味します

AddType 'text/html; charset=UTF-8' html

なぜそれは重要なのか?

テキストが送信されるたびに、特定のcharsetでエンコードされ、反対側でデコードされる必要があるという事実を考えると、charsetの重要性は非常に明白です。これは、適切な文字コーディングがなければ、ブラウザはゴミのようなテキストを表示することになるということを意味します。なぜなら、ブラウザはそれが何であるか単純に理解できず、速やかに無根拠の推測をしなければならないからです。

HTMLフォームでも重要です。なぜなら、サイトやソーシャルメディアプラットフォームのテキストボックスにテキストを入力する際、慎重にエンコードする必要があるからです。この情報が何らかの理由で利用できない場合、誤ったマッピングにより重要な情報が失われる可能性があります。

Charset コード例

文字セットが行うことは、ユーザーとウェブサイトの間でやり取りされるコードを解除し、解読するための鍵を提供することです。

それはコンピュータ内のバイトと文字セット内の文字との間の構造化されたマッピングのセットです。このキーがないと、データは書かれたゴミのように見えます。これは、キーボードを通じてテキストを入力するとき、文字セットが選択した文字をコンピュータメモリ内の特定のバイトにリンクし、そしてテキストを表示するためには、バイトを再び文字に読み戻すことを意味します。

SEOのランキング要因ですか?

文字セットは検索エンジン最適化のためのランキング要因ではありません。ほとんどの検索エンジンは、それを求める人々に関連性があり、有用なコンテンツを提供するという重要な目標に焦点を当てており、その目標に貢献しない他の外部要因を考慮しません。

文字セットは情報の伝達方法によって重要ですが、検索エンジンはそれに興味を持っていません。Utf-8以外の文字セットを使用してもSEOランキングは下がりません。なぜなら、検索エンジンがエンドユーザーに情報を提供できる限り、どの文字エンコーディングを使用していても大きな問題ではないからです。

必要な場合にはどうやって追加すればいいですか?

次のコードを使用して、ウェブサイトに文字セットを追加することができます

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

これを機能させるためには、htmlファイルを含むPHPにこれを含める必要があります。上記のコードは関数ではなくステートメントであるため、すべてのウェブページで機能するわけではないことに注意が必要です。したがって、ページのhtmlを含めるべきです。これは、phpウェブページがヘッダーにUtf-8文字セットを使用していることを念頭に置いています。

異なる種類のcharset

ほとんどの文字セットは、個々のメーカーが顧客のニーズに応えるために生まれました。ほとんどの文字セットは互いに互換性がありません(いくつかの例外を除く)。最も一般的な文字セットは、ASCII(1968年)、ISO 8859-1(1987年)およびUTF-8(1996年)です。

ASCII

英語の文字セット。7ビットで構成され、128文字にマッピングされています。各文字には0から127までの番号が割り当てられています。このコードセットはかなり制限されていますが、他の言語ごとに文字セットを作成するきっかけとなった先駆者の一つです。ほとんどのコンピュータはテキストを表現するためにASCIIコードを使用しています。

ascii 文字セットテーブル

ユニコード

Unicodeは、135の現代および歴史的な言語を1つの標準の下で統一するために作られました。Unicodeは標準であり、自体は文字セットではありません。2019年5月時点で、バージョン12.1のUnicodeには、記号や絵文字を含む137,994文字が含まれています。Unicode標準は、UTF-8、UTF-16、およびUTF-32を定義しています

UTF-8

現在インターネットの主要なコードである。UTF-8は94%のウェブサイトで使用されている。最も一般的な文字、基本的な数字、そして英語を8ビットでエンコードする。UTF-8は最小で1バイトを使用する。また、UTF-8は英語においてASCIIと同一である。これは、あらゆるASCIIテキストもまたUTF-8テキストであることを意味する。

UTF-8 文字コードの例

画像ソース

UTF-16

Unicodeは16ビットで構成されています。元々はWindowsやJavaのようなシステムで使用されていましたが、LinuxやmacOSではあまり普及しませんでした。今日、UTF-16はウェブページの0.01%で使用されています。UTF-16は最小で2バイトを使用します。

UTF-16 Unicode 文字セットの例

画像ソース

UTF-32

Unicodeは32ビットです。UTF-32の利点は、Unicodeポイントが直接インデックスされることです。欠点は、常に4バイトを使用するため、空間の使用効率が良くないことです。これはUTF-16の最大2倍、UTF-8の4倍のサイズを意味します。

結論

では、charsetのSEOの利点は何でしょうか?直接的なランキング要因ではありませんが、charsetには注意が必要です。meta charsetで誤って2つの異なる標準を表示したり、標準のルールに正しく従わなかったりすると、デコードの問題が発生し、コンテンツが正しく表示されません。これはSEOに悪影響を与えます。

文字セットを正しく実装すれば、高い直帰率を防ぐ助けになり、人々があなたにリンクしない理由を与えず、検索エンジンが誤ってコンテンツを解釈することがないため、SEOの努力に役立ちます。